Wpis z mikrobloga

Skopiuj link

24.07.2017, 06:54:16

Niemalże liniowa korelacja pomiędzy PKB a zaufaniem do ludzi, czyli wariacja na temat "world paranoia index"
#polska #swiat #socjologia #datascience #ciekawostki

SIerraPapa - Niemalże liniowa korelacja pomiędzy PKB a zaufaniem do ludzi, czyli wari... — **źródło:** comment_0s0bIfWpHmClOPJHzS5UseBO3BvnqUfQ.jpg

ly000

24.07.2017, 19:15:38

@Wujek_Mietek:
@grajlord ma racje, a ty widocznie nie wiesz o czym on mówi. Przykładowo, na poniższym obrazku masz wykres zmiennych o R^2 na poziomie 0.95, ale o żadnej korelacji liniowej nie ma mowy.

ly000 - @Wujek_Mietek:
@grajlord ma racje, a ty widocznie nie wiesz o czym on mówi.... — **źródło:** comment_7JpoaRiHb71y4bCdofbXOVa6XUvZTlHo.jpg

grajlord

Wujek_Mietek

24.07.2017, 19:22:51

@ly000: Ale ja bym chciał chociaż ten R^2. A wykorzystywanie takich wykresów z korelacjami R^2 na poziomie 0.4 (zgaduję, że ten wykres ma nie więcej jak 0.6) jest standardem w naukach społecznych.

konto usunięte
konto usunięte

grajlord

24.07.2017, 19:49:28

@Wujek_Mietek: Niestety jest standardem nie tylko w naukach społecznych, co nie oznacza, że jest postępowaniem prawidłowym. Obrazowanie nietrywialnej (nieliniowej) zależności przy pomocy prostej regresji jest błędem, a stosowanie r czy R^2 jako miary "siły" tej regresji kontynuacją tego błędu. Skoro taka "regresja" przekłamuje rzecywistość, tak samo będzie w przypadku R^2. Najłatwiej to sobie uzmysłowić próbując sobie ręcznie obliczyć ten współczynnik (R^2) dla naszych danych - wykonane działania nie mają żadnego logicznego

t.....e

konto usunięte 24.07.2017, 19:59:12

@grajlord: no to trzeba policzyć i poznać odpowiedzi na te pytania

na poniższym obrazku masz wykres zmiennych o R^2 na poziomie 0.95, ale o żadnej korelacji liniowej nie ma mowy.

@ly000: no nie ma mowy o korelacji, bo jest za mało danych, więc żaden inny związek też tutaj nie wyjdzie

konto usunięte

ly000

24.07.2017, 20:01:55

no nie ma mowy o korelacji, bo jest za mało danych, więc żaden inny związek też tutaj nie wyjdzie

@takie_chwile_jak_te: mogę zrobić analogiczny wykres dla 1000 wartości.

grajlord

24.07.2017, 20:02:21

no to trzeba policzyć

@takie_chwile_jak_te: no warto by było policzyć, masz rację, ale na pewno nie R^2 xD

ly000

t.....e

konto usunięte 24.07.2017, 20:04:07

@grajlord: czemu nie r2? warto policzyć i sprawdzić co wyjdzie, czy w ogóle hipoteza zerowa zostanie odrzucona, potem jaki wynik, a potem testować kolejne hipotezy i jako najlepiej wyjaśniającą wybrać tę, która daje najlepsze wyniki

t.....e

konto usunięte 24.07.2017, 20:06:29

@ly000: ten Twój wykres jednak z deka inny niż opa, ja bym widział tam linię odcięcią koło 45%, ale to też trzeba mieć teoretyczny pomysł dlaczego np. powyżej pewnego poziomu zaufania zarobki są bez znaczenia, ale dlaczego?

also no 'niemalże liniowa' to przegięcie, ale wykres na pewno nie jest losowy, to lepiej podać kontrhipotezy a nie paplać 'nie ma liniowego i tyle'

grajlord

24.07.2017, 20:15:20

@takie_chwile_jak_te: bo licząc R^2 dla prostej regresji zakładasz inną hipotezę - że twoja regresja jest dobrym modelem do opisania rzeczywistości (że spełnione są założenia tego modelu, np. normalność, homoskedastyczność błędów). To, że nie jest takim modelem, widać z całkiem dużą pewnością po samych danych. Jeżeli dane nie pasują do założeń modelu, to wszystkie jego parametry, współczynniki, miary są niestety nieprawidłowe. Jak bardzo nieprawidłowe - to zależy od tego, jak model odbiega

ly000

ly000

24.07.2017, 20:17:34

ten Twój wykres jednak z deka inny niż opa, ja bym widział tam linię odcięcią koło 45%, ale to też trzeba mieć teoretyczny pomysł dlaczego np. powyżej pewnego poziomu zaufania zarobki są bez znaczenia, ale dlaczego?

@takie_chwile_jak_te: to nie była odpowiedź do postu opa. Chciałem jedynie pokazać dla Wujek_Mietek, że duża wartość współczynnika R^2 nie jest warunkiem wystarczającym korelacji liniowej. W przypadku wykresu opa, liczenie R^2 nie ma sensu, bo korelacji

grajlord

t.....e

konto usunięte 24.07.2017, 20:19:34

@grajlord: a no racja, normalne rozkłady to tu chyba nie będą, raczej prawoskośne, to co byś proponował?

Równie dobrze mogę wykonać 100 innych nikomu-niepotrzebnych wyliczeń i może akurat coś z tego wyjdzie.

@ly000: przypomniała mi się moja magisterka ( ͡° ͜ʖ ͡°)

ly000

eeemil

24.07.2017, 20:21:18

@presha: @kaen: "GDP adjusted for price differences" czyli nie GDP nominalne, ale coś jakby GDP w stosunku do siły nabywczej.

g.....s

konto usunięte 24.07.2017, 20:45:35

liniowa korelacja

@SIerraPapa: Masło maślane. Korelacja, to przypadek zależności liniowej.

dziobaki_sa_jadowite

24.07.2017, 22:17:14

@gnus:
Nieprawda, że jest to "masło maślane", bo istnieją inne typy korelacji niż liniowa.
http://www.emathzone.com/tutorials/basic-statistics/linear-and-non-linear-correlation.html

g.....s

konto usunięte 24.07.2017, 22:50:05

@dziobaki_sa_jadowite: Istnieją inne typy zależności, a nie korelacji. Correlation po polsku w statystyce oznacza zależność, a korelacja - liniową zależność.

dziobaki_sa_jadowite

24.07.2017, 23:47:31

@gnus: Nie wiem po co dyskutuje o semantyce statystyki o tej godzinie, ale dla zabawy podeprę się dalej tym co mogę znaleźć w internecie.
Zacznijmy od PWN, który nie używa w żadnym miejscu słowa "liniowość" w żadnej odmianie przy definicji korelacji.
https://sjp.pwn.pl/sjp/korelacja;2474043.html - zważ na użycie w definicji słowa "współzależność".
Pójdźmy przez wikisłownik który wskaże trop tego całego zamieszania
https://pl.wiktionary.org/wiki/korelacja - ta definicja również nie wskazuje że korelacja to stricte korelacja

Wujek_Mietek

25.07.2017, 09:24:38

Niestety jest standardem nie tylko w naukach społecznych, co nie oznacza, że jest postępowaniem prawidłowym.

@grajlord: To prawda. Ale każdy obrońca socjalizmu posługuje się takimi wykresami, gdzie jest nagromadzenie punktów blisko początku wykresu a dalej to już loteria. Nawet naszego wykopowego Einsteina chyba widziałem z takimi wykresami.

grajlord

25.07.2017, 15:42:02

normalne rozkłady to tu chyba nie będą, raczej prawoskośne, to co byś proponował?

@takie_chwile_jak_te: przy regresji z problemem nienormalności rozkładu zmiennej najczęściej wiąże się potrzeba transformacji, ja z reguły robię box-cox (lub pokrewną), ale zwykle wystarczy np. zlogarytmować. To jednak nie rozwiązuje problemu confoundingu albo jakichś nieliniowości wyższego stopnia i wtedy można próbować dorzucać inne zmienne do modelu, wprowadzać stratyfikację, albo po prostu stosować modele nieliniowe. Nie ma na to niestety

konto usunięte

Aktywne Wpisy

kamsher

kamsher +24

4 godz. i 29 min temu

Skala przegrywu. Jeśli dany opis dotyczy was dajecie sobie jeden punkt. Napiszcie podsumowanie w komentarzu.
1.Wzrost poniżej 180cm
2.Nigdy się nie całowałes
3. Nigdy nie uprawiałeś seksu za darmo
4. Nie masz jakiejś kończyny
5. Masz trądzik
6. Nie masz znajomych
7. Masz hiv
8. Masz cukrzyce
9. Nigdy nie byłeś za granicą
10. Jąkasz się
11. Gnębiono/ jesteś gnębiony w szkole
12. Spotkał się mobbing w pracy
13. Masz podwójny podbródek

Hopsa

Hopsa +7

4 godz. i 10 min temu

Czym mogę pozytywnie zaskoczyć chłopaka z którym się od jakiegoś czasu spotykam?
Jakie cechy powinna mieć w dzisiejszych czasach dziewczyna z którą chce się być?

Staram się wymyślać jakieś fajne plany nawet na luźne randki, seks też staram się żeby był fajny i nie robię tego na siłę, próbuje jakoś pokazywać się za każdym razem w różnych innych stylówkach fajnych i ogólnie staram się pokazywać swoje zaangażowanie w relacje.
Nie pisze z

Aktywne Wpisy

Aktywne Znaleziska

Bobi - najstarszy pies na świecie nie żyje

Spadek PKB przez 2 kwartały z rzędu. GUS potwierdza techniczną recesję

Tragedia na A1. Jest wniosek o ukaranie łódzkiego prawnika.

UK: od 2024 kary za zbyt niską sprzedaż elektryków

Blokowanie adblocków przez YouTube nielegalne? Konfrontacja zaczyna się zaostrza

Popularne tagi