Wpis z mikrobloga

bo zeby mogł zaczac grac musi wgl nauczyc sie grac :)
jezeli bedzie grał sam przeciwko sobie nie bedac nauczony to bedzie grał przeciwko komus kto gra totalnie losowo i nauczy sie grac tylko z kims kto gra losowo.

po nauczeniu chce zrobić self-play zeby nauczyc go wiecej ale pierwsze uczenie musze wykonac z czyms sensownym
  • Odpowiedz
@SzCzoteckY: No tak, najpierw nauczy się optymalnej strategii przeciwko grze losowej. Następnie nauczy się optymalnej strategii przeciwko tej wcześniej nauczonej. Później następnej optymalnej. I tak dalej. Aż do zbieżności ze strategią optymalną dla gry (oczywiście przy uwzględnieniu niedoskonałości modelu i ograniczeń mocy obliczeniowej).

No ale może masz inną wizję. Pytam z ciekawości bo sam od jakiegoś czasu dłubię przy tym :-)
  • Odpowiedz