Aktywne Wpisy
Reichsmarschall +19
krucjan +67
jestem 5 miesiąc na keto i chciałbym się pochwalić że robię formę życia. ostatnio lata byłem taki typowy skinnyfat z tatusiowym brzuszkiem, przez te 5 miesięcy zrzuciłem jakieś 20kg, znajomi mówią mi że bardzo dobrze wyglądam. wiem że szczur ze mnie, ale ja tam się cieszę, powoli odkrywają się mięśnie brzucha, góra jest już zauważalna. mój cel to dociąć jeszcze tyle żeby był wyraźny 6pak a potem będę stopniowo zwiększał kalorie, żeby
#python
Uczę się data science i ML. Spotkałem się z czymś, czego nie do końca rozumiem. Do tej pory poprzez traintestsplit dzieliłem sobie zbiór na 2 grupy, wiadomo. Z kolei w jednej książce spotkałem się z pomysłem, aby dzielić nie na 2, ale na 3 grupy. Ta 3 miałaby być walidacyjną i miałaby służyć porównaniu z tą testową. Nie lepiej zrobić sobie pętlę z powiedzmy 30 iteracjami uzyskując różne grupy testowe i na nich od razu sprawdzać mając już gotowe jedno badanie?
To znaczy, ze dane testowe maja inna dystrybucje niz danych, ktore modelujesz i jest w nich cos wiecej. Stad dane testowe, ktore nie mialy nigdy stycznosci z danymi treningowymi
Czyli podsumowując, kiedy robię sobie podział i staram się dostroić ML, to prawie na pewno będzie to przekłamane, ponieważ jest to dopasowane tylko do 1 zbioru testowego?
Ta ksiazka tlumaczy dlaczego.