Wpis z mikrobloga

Wg tzw. cheat-sheet map na stronie sklearn wynika, ze skoro przewiduje kategorie i mam labelled data w ilosci powyzej 100 tysiecy, to powinienem uzyc klasyfikatora SGD albo kernel approximation, jesli SGD nie dziala.
Generalnie mam excela z roznymi pomiarami (okolo 20 kolumn), i dobrze byloby przypisac do nich jakies wagi, bo niektore pomiary sa wazniejsze od innych, jesli chodzi o predykcje kategorii. W jaki sposob moge uzyc tego klasyfikatora SGD i jednoczesnie przypisac jakies wagi do pomiarow? #machinelearning
  • 2
  • Odpowiedz
@bullets: Jak napisał kolega wyżej - zacznij od regresji logistycznej, potem przeszedłbym do MLP, możesz też spróbować tego SVMa uczonego przy pomocy SGD (czyli to, co domyślnie jest w scikicie jako SGDClassifier). Pamiętaj o przeskalowaniu cech. Możesz też spróbować drzew decyzyjnych i lasów losowych, ewentualnie XGBoosta.

Wagami się nie przejmuj - algorytm sam ma się wyuczyć tego, od czego zależy decyzja. Jeśli masz cechę, która nie dyskryminuje klas, to
  • Odpowiedz