Wytłumaczy mi ktoś class-weight w scikit-learn, np. w drzewie decyzyjnym? Załóżmy że mam dane uczące z 3 klasami, liczby próbek 100, 10, 10. Jak rozumiem dla drzewa z domyślnymi ustawieniami zostanie wykorzystane wszystkie 120 próbek. A co w przypadku np. class-weight="balanced"? #sklearn #python #datascience #machinelearning
@psi-nos: class_weight przypisuje wage do tego jak wazna jest klasa do trenowania drzewka, wiec zawsze wszystkie klasy beda wykorzystane.* Jako default jest ze kazda klasa jest rownomiernie wazna z pozostalymi. Balanced daje wage odwrotnie proporcjonalna do czestotliwosci wystepowania klasy.

* chyba ze przypiszesz wage 0, to wtedy klasa bedzie ignorowana
  • Odpowiedz
@n0c0Mpr3h3nD: chodziło mi bardziej szczegółowo. Co to znaczy ważna. Ale już chyba ogarnąłem, że waga jest uwzględniana przy funkcji straty przy tworzeniu węzła drzewa (wyborze najlepszego podziału).
  • Odpowiedz