Aktywne Wpisy
mickpl +148
Januszom zachodzącym w głowę gdzie no ci studenci na których od 3 miesięcy czeka mój kurnik podzielony na 6 pokoi odpowiadam.
Po pierwsze Ukraińcy dalej masowo opuszczają Polskę (głównie na zachód), a prawie połowa deklaruje wyjazd do końca roku.
Po drugie zaledwie 54% tegorocznych maturzystów planuje iść na studia. 10 lat temu szło 95%. Czyli nie tylko liczba młodych generalnie spada, ale o połowę spadła liczba osób idących na studiach.
Czy
Po pierwsze Ukraińcy dalej masowo opuszczają Polskę (głównie na zachód), a prawie połowa deklaruje wyjazd do końca roku.
Po drugie zaledwie 54% tegorocznych maturzystów planuje iść na studia. 10 lat temu szło 95%. Czyli nie tylko liczba młodych generalnie spada, ale o połowę spadła liczba osób idących na studiach.
Czy
Bertoos +140
1.Czy metody SMOTE używamy przed podziałem zbioru na treningowy i testowy?
2.Co w przypadku gdy po upsamplingu SMOTE (zrobionym na zbiorze testowym) otrzymujemy dla modeli niższe accuracy niż bez tego upsamplingu?
3. Wszystkie rady będą mile widziane :)
Poniżej sposób jakim zrobiłem upsampling:
s = SMOTE(samplingstrategy = 1, randomstate=1)
Xtrainsmote, ytrainsmote = s.fitresample(Xtrain, y_train.ravel())
#datascience
https://kiwidamien.github.io/how-to-do-cross-validation-when-upsampling-data.html
@srutownik:
"Czy moje dane można w łatwy sposób podzielić w przestrzeni, a jeśli nie to które zmienne powodują największe anomalie"
Zacząłbym od takiego założenia, 16% to jednak dosyć dużo i powinno być widać wizualnie ile