Wpis z mikrobloga

Skopiuj link

09.03.2016, 14:06:13

Ważny dzień. Pierwszy raz program komputerowy ograł topowego gracza w Go. Komputery od wielu lat cisną zawodowych graczy w szachy, jednak Go (azjtycka wersja kropek ( ͡° ͜ʖ ͡°)) zawsze było dla komputerów zbyt skomplikowane. Z roku na rok sztuczna inteligencja radziła sobie coraz lepiej, ale zawsze daleko było do profesjonalistów (chociaż już w 2015 AlphaGo ograł europejskiego mistrza). Kilka godzin temu Lee Sedol, czyli jeden z najlepszych graczy na świecie przegrał swój pierwszy mecz.

Jeśli chodzi o techniczne detale - od dawna do gry w Go używa się tzw. monte-carlo tree search. Tak jak sobie wyobrażacie dobrym pomysłem jest wykonanie ruchu i sprawdzenie jak może odpowiedzieć na niego przeciwnik (to co wszyscy robią w głowie grając np. w szachy :)). Komputery grają podobnie, jednak wbrew pozorom nie mogą sprawdzać wszystkich możliwych ruchów - plansza do Go ma 19x19 pól, tak więc sprawdzenie czterech pierwszych ruchów wymaga (19x19) do czwartej kombinacji do sprawdzenia (co zwykłemu laptopowi zajmie przynajmniej miliard lat). Dobrym pomysłem jest więc sprawdzanie tylko tych ruchów, które mają jakiś sens i dopiero dla nich sprawdzać jak potoczy się rozgrywka w następnych ruchach (wybierając również tylko te ruchy które mają sens). Monte-carlo tree search potrafi wybierać sensowne ruchy - robi to trochę losowo (używając np. mirkorandom), trochę na podstawie funkcji oceniającej wartość ruchu. Stworzenie takiej funkcji to największe wyzwanie.

Inżynierowie z Googla postanowili stworzyć ową funkcję przy użyciu głębokich sieci neurnowych. Budowa takiej sieci polega na stworzeniu dużej ilości prostych funkcji z pewnymi współczynnikami. Funkcje te są ze sobą połączone (wyniki z jednych są argumentami innych). Po uzyskaniu wyniku z tych wszystkich funkcji algorytm sprawdza go z wynikiem oczekiwanym (dostarczonym przez twórców sieci) i jeśli wynik nie był trafiony, to współczynniki tych wszystkich funkcji są delikatnie zmieniane. Dzięki temu po wielu iteracjach taka sieć faktycznie zaczyna dobrze odpowiadać.

Mój opis to oczywiście ciekawostka "dla wszystkich". Jeśli ktoś się interesuje tematem to można przeczytać papera wydanego przy okazji tworzenia Alpha Go: http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html. Niestety jest płatny, moim zdaniem nie warto go czytać - jest płytki i krótki, zbyt dużo nie zdradzili :D

Jutro rewanż, trzymajcie kciuki: https://deepmind.com/alpha-go.html #programowanie #informatyka #deeplearning

konto usunięte
MacDada
R4vPL
Ofacet
konto usunięte
+17 innych

i.....k

konto usunięte 09.03.2016, 14:13:05

@AhoCorasick: Tutaj zapis gry:

AhoCorasick

09.03.2016, 14:18:09

@informatyk15000k:
Jest. Przy czym ostudzę trochę entuzjazm. Kiedyś sporo grałem w Go i byłem całkiem dobry (1 dan na gokgs). Jednak oglądanie meczy profesjonalistów dla mnie mija się z celem - wygląda to tak jakby przez dwie godziny stawiali kamienie na losowych polach,a potem w losowym momencie ktoś się poddaje.
https://www.youtube.com/watch?v=vFr3K2DORc8

i.....k

konto usunięte 09.03.2016, 14:19:07

@AhoCorasick: Ja miałem gdzieś może 4k na kgs. Końcówki też bywają interesujące.

Aktywne Wpisy

ProstolinijnyW

ProstolinijnyW +131

5 godz. i 34 min temu

Jak w ogóle można popierać ROD?

-Ogródki zajmują ogromną przestrzeń bardzo często w centrum miast
-Osoba z ulicy nie ma tam wstępu i nie czerpie z tego powodu żadnych korzyści
-W zarządach siedzą stare komuchy
-Ludzie tam palą byle gównem
-To i tak własność miasta więc nie ma problemu by przeznaczyć ten teren na coś innego
-Jak jakiś boomer chce sadzić cebulę czy marchewkę to niech przeprowadzi się do powiatowego albo kupi

Sin-

Sin- +97

5 godz. i 24 min temu

Chwale się. Zmieniam robotę i jestem już po rekrutacjach i wyborze kolejnego pracodawcy. DevOps here:
- kilka wysłanych CV
- 4 rozmowy
- 3 pozytywne odpowiedzi

Udało się wynegocjować to co chciałam na UoP - 18k aczkolwiek było dużo ciężej niż w zeszłym roku. A przynajmniej takie mam wrażenie.

Poziom samej rekrutacji jako procesu wzrósł. Wzrósł także czas oczekiwania na feedback.

Ps: Mam już kilka lat doświadczenia w zawodzie i nie startowałam

Aktywne Wpisy

Aktywne Znaleziska

Pacjentka zaatakowana w zgierskim szpitalu. Napastnik zatrzymany

CBA weszło do Polskiej Agencji Inwestycji i Handlu. Chodzi o aferę wizową

Poszukiwany 13-latek z Mikołowa

Węgry zgodziły się na akcesję Szwecji do NATO

Podkomisja smoleńska chciała wykonać eksperyment z trabantem, brzozą i Tu-154

Popularne tagi