Profil: @damcz - Znaleziska (komentowane)

Najlepszy piłkarz świata wg algorytmu maszynowego uczenia się

Napisałem program, który używa maszynowego uczenia (machine learning) do tego, żeby stworzyć ranking najlepszych piłkarzy. Chciałem podzielić się z Wami wynikami...

z dodany: 05.05.2018, 13:07:56

damcz

damcz 05.05.2018, 15:38:46

-2

@wedfknjskvn:

To, czy to jest maszynowe uczenie się, czy nie, to kwestia definicji i nie jest to szczególnie istotne, ale wg mojej i powszechnie przyjętej definicji maszynowego uczenia się, ten algorytm jak najbardziej można nazwać maszynowym uczeniem się.

Typowy algorytm maszynowego uczenia się działa w taki sposób, że są jakieś dane, jest jakiś model, jest jakaś funkcja kosztu i jest jakiś algorytm optymalizujący. Algorytm uczy się wag, tak żeby zminimalizować wartość funkcji kosztu. Ten algorytm działa dokładnie w taki

damcz

damcz 05.05.2018, 15:42:33

@venomik:

Wg przyjętych przeze mnie definicji - można to nazwać zarówno maszynowym uczeniem się i analizą statystyczną. Maszynowe uczenie się ze statystyką ma wiele wspólnego.

damcz

damcz 05.05.2018, 15:53:23

@trelkovsky: Zgadzam się, że z tym że sposób Fifa jest lepszy. Tak jak napisałem - należy to zsumować to z tym, co wiemy sugerując się bardziej tym, co wiemy.

Ale wyniki są interesujące, dlatego że bazują na czymś innym niż na subiektywnej ocenie i mogą dostarczyć informacji, których nie widać z punktu widzenia człowieka (np. z punktu widzenia człowieka nie widać że David Alba jest bardzo dobry, a wg rankingu

damcz

damcz 05.05.2018, 15:55:14

@x-ray: To nie są najlepsi zawodnicy ostatniego 5-lecia, tylko najlepsi zawodnicy na 17 kwiecień 2018 r. (algorytm bierze ostatnie mecze pod uwagę bardziej niż te 5 lat temu).

damcz

damcz 05.05.2018, 16:05:26

@cevilo:

"Wedle takiego algorytmu nie ma żadnej różnicy pomiędzy zawodnikiem b klasy, z drużyny, która wygrywa dużą liczbą bramek, od np. rywalizacji w LM"

Jeżeli te drużyny z b klasy nie grały z żadnymi drużynami z a klasy, które nie grały z żadnymi drużynami z 3 ligi, które grały z drużynami z drugiej ligi itd. do ligi mistrzów, to wtedy algorytm na podstawie danych nie ma szansy się nauczyć, że drużyny grające w lidze mistrzów są lepsze od tych z A

damcz

damcz 05.05.2018, 16:12:45

@ostoja:

"en algorytm pokazuje zawodników, którzy dużo grają w dobrych drużynach (ale już bez odniesienia czy ta drużyna jest dobra w La Liga czy pucharze pcimia dolnego) - stąd takie kwiatki jak Cavani, Meunier czy Jordan Henderson. "

Ale jak widzisz w rankingu masz wielu zawodników z ligi hiszpańskiej a masz tylko jednego z ligi brazylijskiej. Więc algorytm jest w stanie nauczyć się tego, która liga jest dobra, a która

damcz

damcz 05.05.2018, 16:17:17

@qwarq: Tak, ale jeżeli np. przeanalizujesz bardzo wiele meczy Barcelony, to znajdą się wśród tych meczy takie mecze, w których nie grał Leo Messi (+ czasami Leo Messi schodzi z boiska) więc algorytm jest w stanie się nauczyć w jakimś stopniu, który zawodnik decyduje o zwycięstwach danej drużyny. Poza tym algorytm ma porównanie poprzez analizę meczy reprezentacyjnych, gdzie piłkarze grają w innych składach.

Zgadzam się, że algorytm dawałby trafniejsze wyniki,

damcz

damcz 05.05.2018, 16:21:54

Bardziej szczegółowo na Twoje pytanie odpowiedziałem wyżej.

damcz

damcz 05.05.2018, 17:01:50

@jacekKobr:

"Z kodu wynika, że zbioru testującego nie było (testing = False) - dlaczego? Czy wobec braku testu wiadomo jak dobrze/źle generalizuje uzyskany model?"

W finalnej wersji, którą wrzuciłem do repozytorium na GitHubie testing = False, ale wcześniej oczywiście sprawdzałem na danych testowych jakie wartości hiperparametrów dają najlepsze rezultaty (i wtedy ustawiałem testing na True i ustawiałem odpowiedni zbiór testowy). Więc testowałem algorytm z różnymi wartościami hiperparametrów (chociaż muszę przyznać, że nie miałem na to zbyt dużo czasu i nie robiłem tego szczegółowo, dlatego pisałem, że należy podejść do wyników z

damcz

damcz 05.05.2018, 17:19:34

@balrog84:

Jak najbardziej zawodnik, który czasem siada na ławce ma szanse z zawodnikiem, który cały czas gra w podstawowym składzie.

Wadą algorytmu jest to, że zawodnicy, którzy są kontuzjowani lub często siedzą na ławce mają większe szanse na bycie na szczycie (również na dole) rankingu, dlatego że algorytm ma większe szanse się wtedy nauczyć, czy dany zawodnik decyduje o tym, że dana drużyna wygrywa/przegrywa. Przykładowo Piszczek jest bardzo wysoko w

damcz

damcz 05.05.2018, 17:29:49

@ortofosforan:

Jeżeli przeanalizujesz jak działa algorytm, to zauważysz, że algorytm właśnie uczy się przewidywać rezultat spotkań na podstawie tego, jacy piłkarze grają w pierwszym zespole i jacy piłkarze grają w drugim zespole. Efektem ubocznym tego jest to, że wagi odpowiadające piłkarzom trenują się w taki sposób, że czym waga jest wyższa tym lepszy zawodnik. I ranking jest konstruowany właśnie na podstawie tych wag.

damcz

damcz 05.05.2018, 17:32:34

@karolak92: Tak, ale to, że wg tego algorytmu złotą piłkę dostanie piłkarz słabej ligi jest odpowiednio mało prawdopodobne to poziomu tej ligi (chyba, że tak jak pisałem wyżej drużyny ze słabej ligi nigdy nie grały z kimś z pierwszej ligi albo z kimś kto z nimi grał, wtedy algorytm nie ma szansy nauczyć się która liga jest lepsza). I tak właśnie powinno być, że jest to teoretycznie możliwe, ale bardzo

damcz

damcz 05.05.2018, 17:40:02

@szaloneneutrino:

Załóżmy, że jest gracz X, który załóżmy gra w Barcelonie i za każdym razem stoi na boisku jak kołek. Barcelona jest dobra więc często wygrywa, więc jego rank idzie w górę. Ale wśród tych 5 lat będą takie mecze (nie musi to być cały mecz, wystarczy że zejdzie na przykład w 80 minucie), w których gracz X będzie siedział na ławce rezerwowych. W tym czasie Barcelona będzie grała jeszcze

damcz

damcz 05.05.2018, 18:14:34

@JayJay12:

Algorytm nauczy się tego, jaka liga jest najlepsza poprzez to, że te drużyny grają ze sobą w lidze mistrzów albo na przykład w klubowych mistrzostwach świata. Czyli jeżeli Real wygra z Celticem 2:0, to wtedy rank wszystkich drużyn w lidze szkockiej spada też w dół, bo załóżmy, że piłkarze Realu mają średnio rank 5, więc jeżeli Cetlic z nimi przegra to będzie miał rank średnio załóżmy 4, więc jeżeli

damcz

damcz 05.05.2018, 18:28:28

@Kondoniusz:

Jak widzisz na szczycie rankingu są piłkarze najlepszych drużyn, więc to nie tak. Mówiąc "najbardziej zwiększa prawdopodobieństwo wygranej drużyny poprzez obecność w składzie" mam na myśli, że jeżeli umieścisz go z jakimiś losowymi zawodnikami, to najlepszy jest ten, który najbardziej zwiększy szanse wygranej. Chociaż algorytm nie bada dokładnie jak danymi piłkarz gra z losowymi zawodnikami, bo bazuje na danych, gdzie zawodnik grał z innymi zawodnikami ze swojej drużyny (czyli

damcz

damcz 05.05.2018, 18:30:07

@szuleer: Zawodnik ma takie same szanse być na szczycie wg tego algorytmu niezależnie od tego na jakiej pozycji gra.

damcz

damcz 05.05.2018, 18:32:33

raczej zaskakująco c-----o XD Taki Messi jest stosunkowo nisko w rankingu, bo przez kontuzje omija sporo meczów, Neymar to samo. Za to na drugim miejscu w rankingu za 2017 jest Adam Rooney - musiałem sprawdzić kto to w ogóle jest i czy nie pomylono go z Wayne'em XD

@ostoja: Zawodnicy, którzy mieli kontuzje właśnie mają większe szanse być na szczycie / na dole rankingu. Jak poszukasz, to znajdziesz gdzieś wyżej

damcz

damcz 05.05.2018, 18:57:10

udział danego zawodnika w meczu, reprezentowany przez jakąś zmienną losową, nie jest zmienną niezależną od pozostałych

@jacekKobr: Zgadza się - udział zawodnika w meczu nie jest zmienną niezależną od pozostałych. Ale w jaki sposób to się przekłada na rezultaty? W taki sposób, że algorytm nie bada tak naprawdę, jak bardzo dany piłkarz zwiększa szanse wygranej po włożeniu go do losowego zbioru innych piłkarzy, tylko bada jak dobrzy są piłkarze jeżeli

damcz

damcz 05.05.2018, 19:28:26

Swoją drogą, takie czysto teoretyczne pytanie, jakby ranking zareagował na drużynę, która wygrałaby wszystkie mecze w sezonie?

@Kondoniusz: Wszyscy zawodnicy byliby wysoko (albo prawie wszyscy) w stosunku do zawodników z drużyn z którymi grali. Najwyżej byliby ci zawodnicy, którzy byli obecni w meczach, gdzie drużyna wygrywała wyżej (albo byliby na boisku wtedy, kiedy drużyna strzelała gole i nie byłoby ich na boisku wtedy, kiedy drużyna traciła gole, uwzględniając zmiany zawodników).

damcz

damcz 05.05.2018, 19:40:43

@Koliat: Tak samo jak wszystkich innych zawodników - jeżeli drużyna wygrywa kiedy dany bramkarz jest na boisku, to znaczy że bramkarz jest dobry; jeżeli drużyna przegrywa kiedy dany bramkarz jest na boisku, to znaczy że bramkarz jest zły. Oczywiście, tak jak ktoś słusznie zauważył, jest to dalekie od ideału, szczególnie w przypadku bramkarzy i potrzeba bardzo wielu meczy (najlepiej w różnych drużynach i również takich w których dany bramkarz nie