Potrzebuje opinii kogoś bardziej doświadczonego jeśli chodzi o radzenie sobie z imbalanced data. Regresja logistyczna. Mam zbiór danych z 4000 wierszy (przed podziałem train test split) i w tym zbiorze jest tylko 16% wartości 1 wiec zbiór danych jest niezbalansowany. I tutaj mam pewne wątpliwości:
1.Czy metody SMOTE używamy przed podziałem zbioru na treningowy i testowy? 2.Co w przypadku gdy po upsamplingu SMOTE (zrobionym na zbiorze testowym) otrzymujemy dla modeli niższe accuracy niż bez
@elim: nie wiem czy to coś oznacza - dla mnie to ostrzeżenie, żeby nie słuchać starego capa, który przed niczym ich nie ochroni bo albo pójdzie siedzieć albo umrze bo stary