Jak to rozumieć:

Finally, a valid hypothesis is not based on the sample to be used to test the hypothesis. This tautological logic does not generate any productive information


Chodzi o to, o czym wszędzie trąbią, że wynik testu (poprawnie wykonanego) nie zależy od próbki? Bo trochę dziwnie to ubrane w słowa.

#statystyka #matematyka
@grajlord: Nie ma tam mowy o wyniku. Mowa jest tam o tym, że aby postawić hipotezę, nie korzystaj z tych samych danych, z których będziesz dowodził jej prawdziwości - co jest bardzo częstym błędem popełnianym przez naukowców (szczególnie w medycynie), że opierając się na zebranych danych formułują hipotezę analizując dane i tymi samymi danymi ją dowodzą.
@grajlord: Górny i dolny wykres to dwa wykresy prezentujące otrzymane wyniki - oczywiście zakładamy, że dane pochodzą z rozkładu normalnego, zatem wartość średnia i odchylenie standardowe próbki determinuje nam postać rozkładu. No i te dwa wykresy to dwa przykładowe wyniki.

Jak średnia z hipotezy wpada w te przedziały to nie możesz odrzucić H0.
@grajlord: Chcesz na podstawie pierwszej próbki oszacować, jaka będzie średnia dla drugiej? Cóż, wielkiej filozofii tu nie ma - twoim najlepszym oszacowaniem jest, że średnia będzie taka sama. Jeśli masz dwie różne próbki możesz porównać ich średnie (a zatem czy pochodzą z tego samego rozkładu).
@grajlord: Spoko, jakoś się dogadujemy. Pamiętaj co znaczy p-value - ma bardzo prostą interpretację. Jest to prawdopodobieństwo uzyskania takich wyników, jakie otrzymałeś, przy założeniu, że hipoteza zerowa jest prawdziwa - tyle. Natomiast wynik testu statystycznego zależy od wielkości próbki, przyjętej hipotezy alternatywnej itd.
#statystyka

@Scyth: Siema, teraz już ci nie dam spokoju ;)

Trochę poczytałem i chcę zrobić najpierw jakąś normalną statystykę opisową [na podstawie tego, czyli Breakdown.](http://www.statsoft.com/textbook/basic-statistics/#Breakdown: Descriptive statistics by groups)

Zrobiłbym 3 takie "drzewka" - po jednym dla każdej z 3 zmiennych zależnych (dalej jest napisane, że można zrobić "Discriminant Function Analysis" żeby te zmienne zależne potraktować "zbiorczo", ale na razie nie będę wchodził w takie szczegóły).

I teraz pytania:

1.
#statystyki #transport #statystyka Ja wiem, że wykop nie jest może odpowiednim miejscem na takie pytania ale GUS mi nie odpowiada na maile, do ich łódzkiego oddziału będę miał czas przejść się chyba dopiero w środę to co mi tam spytam tu ;p

Otóź w rocznikach dotyczących działalności transportu podawane są takie dane jak Przewozy pasażerów. Podzielone są one na:

transport kolejowy

transport samochodowy

transport lotniczy

Ale są to tylko dane dla całej
@czlapka: Z tego co pamiętam to nie. Transport lotniczy odbywa się głównie miedzy województwami (kolejowy zresztą też) Kiedyś widziałem dane dotyczące transportów wychodzących z województw - coś jakby eksport import, ale dotyczył towarów.
@stahs: Kurczę, mówisz? :/ Coś takiego jedynie znalazłem http://www.eregion.wzp.pl/transport/przewozy-pasazerow-ogolem-transportem-samochodowym-zarobkowym.html dla podkarpackiego no ale to właśnie "Przewozy pasażerów ogółem transportem samochodowym ". A nie orientujesz się może czy są jakieś dane dla województw z ostatnich 10 lat, w podobnym przekroju( znaczy, że 3 składowe dają całość) dotyczące transportu a najlepiej transportu zrównoważonego? ;p