Aktywne Wpisy

Sultan_Heheszkuw +492
źródło: 1000044792
Pobierz
LaudatorLibertatis +434
W trakcie sprawdzania biznesów Lewandowskiego natrafiłem na Rafała Collinsa i jego tajemnicze zniknięcie z kilku firm. Zapraszam na analizę biznesów Braci Collins, którzy występowali w TVN Turbo, dawali pracę Tomaszowi Komendzie, pokazywali się na balu charytatywnym swojej fundacji z Lechem Wałęsą i grali z WOŚP dając do licytacji rzekomo luksusowe zegarki stworzonej przez siebie marki Tismo Geneve.
Co jest w tle tych historii? Kilkanaście spółek w Polsce i Wielkiej Brytanii, wyrok karny, egzekucje
Co jest w tle tych historii? Kilkanaście spółek w Polsce i Wielkiej Brytanii, wyrok karny, egzekucje
źródło: posp2 20260406
Pobierz




Dlaczego aby zastosowaćalgorytmy uczenia maszynowego dane muszą mieć rozkład normalny? Wgl tego nie czaje.
źródło: comment_1621969841p4XIW3SaWq6HPCi6eLPjcy.jpg
Pobierz@yras8: Raczej nie muszą. Estymator to statystyka służąca do szacowania wartości parametru jakiegoś rozkładu/modelu. Rozkład normalny daje ci tylko to, że wiedząc, że dane mają rozkład normalny możesz określić jaki rozkład będzie miał estymator parametru.
Innymi słowy: Chcesz określić wartość jakiegoś parametru w populacji (np. średni wzrost Polaków), a masz tylko jakąś próbkę tej populacji (wzrost stu
@Nicolas_Bourbaki:
Analiz się nie wykonuje. Ale są dziesiątki algorytmów które wymagają przynajmniej standaryzowania danych. (puść sobie dowolnego SVN bez standaryzacji to się zdziwisz). A praktyka pokazuje że głupie drzewa działają 2x lepiej jak znormalizujesz dane, niekoniecznie do N(0,1)
@yras8: podaj proszę kontekst, bo ciężko się odnieść nie wiedząc o jakie konkretnie estymatory chodzi
Z tego co pamietam, niektore modele ML duzo lepsze wyniki uzyskują przy rozkladzie normalnym cech i na takich danych powinny byc uczone. Drzewopochodne są akurat odporne na typ rozkladu.
@Nicolas_Bourbaki:
@xstempolx: No właśnie. Normalizacja, czy standardyzacja w pewnym sensie sprowadza ci dane do takiej samej "jednostki", np do odchylenia standardowego w przypadku tej drugiej.
Tak naprawdę ten rozkład normalny nawet w przypadku statystyki jest przereklamowany. To może miało sens w erze przed komputerami gdzie wyznaczenie przedziałów ufności było utrudnione. Dlatego trzeba było sprowadzić rozkład do jakieś wyspecyfikowanych rozkładów typu