Czy ktoś wstawiał linie o określonym kształcie "między" punkty tak aby jak najbardziej wpasować linie w punkty (zdjęcie poniżej) i później z tego określił pole powierzchni między linia zbudowaną na punktach a tą która określoną która wstawiamy?
Za każdą poradę, artykuł będę wdzięczny

#naukaprogramowania #matplotlib #python #programowanie #datascience #analizadanych
mozeskomentuje - Czy ktoś wstawiał linie o określonym kształcie "między" punkty tak a...

źródło: comment_h2ZLA3oFnBhy4IiDT96JK0t47cwCGNXz.jpg

Pobierz
  • 4
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@mozeskomentuje: Uogólnione modele liniowe powinny załatwić sprawę. Można też wykonać dopasowanie oparte np. na metodzie największej wiarygodności i skorzystać z kryterium informacyjnego (Bayesa-Schwartza albo Akaikego). Pole powierzchni powinna załatwić różnica dwóch pól powierzchni między prostą (krzywą) wpasowaną, a osią odciętych.
Po co Ci to w ogóle potrzebne? Dopasowujesz rozkład?
  • Odpowiedz
cieliczka - Popularność 12 gatunków filmowych w latach 1910-2018

Tutaj ta sama, al...

źródło: comment_4e7go8iQrIk2gMwDbhNKfB1kUCZ1CPdQ.jpg

Pobierz
  • 41
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

via Wykop Mobilny (Android)
  • 75
@cieliczka: interesujące, na przykładzie thrillerów można wysnuć wniosek, że ludzie szukają w filmach mocniejszych emocji podobnie horrory tendencja wzrostowa, może nawet trochę napędzana rozwojem efektów specjalnych. Komedie constans, ludzie potrzebują uśmiechu cały czas ( ͡° ͜ʖ ͡°)
  • Odpowiedz
@luzny_lori: @Tomek7: ok chyba juz zrozumialem co jest nie tak
spark faktycznie ustawia FAIR, ale „scheduling across applications” byl na domyslnych ustawieniach i bede musial zmienic, zeby np ustawic limit „core’ow” uzywanych przez jedna aplikacje

w dokumentacji pod „job scheduling” sa te informacje jakbyscie chcieli poczytac
  • Odpowiedz
Cześć, czy jest ktoś kto studiuje Data Science na PJATK ? Jak ocenia to co można się tam nauczyć? Czy warto zmieniać SGH Big Data na ten kierunek ? (chociażby żeby dyplom był z informatyki) ?? Czy do ETL potrzebny jest bezwzględnie dyplom z inf. ? I czy jak mam zamiar zajmować się Data Science to jaka droga jest najlepsza (od ETL?) czy inna?
#sgh #pjatk #datascience
  • 4
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@musialmi: Toś mi akurat skomentował/(a) najmniej chyba istoty element artykułu. Widziałem to AFAIR gdzieś w materiałach u Andrew Ng i on tego też za bardzo nie drążył. Może masz rację ¯\_(ツ)_/¯
  • Odpowiedz
#bigdata #sgh #machinelearning #datascience
Hej, słuchajcie mam takie pytanie. Jest tu jakiś absolwent Big Data na SGH i może podzielić się tym jak jest na rynku? Aktualnie studiuję BD na SGH i mam średnie odczucia. Czy jest sens to teraz rzucać i iść na jakąś informatykę ? Generalnie interesuje mnie głownie działka ML, hurtownie danych, cloud computing, czyli mniej analizy a więcej robienia. Myślałem,
  • 6
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@trelis_morelis: Sama uczelnia jak i kierunek jest szanowana - szczególnie przez działy HR, więc jak umiesz ładnie odpowiedać na pytania rekrutacyjne to spokojnie się gdzieś załapiesz. Warto szczególnie działać w kołach naukowych i działać w projektach studenckich. Jakbyś chciał iść w typowy machine learning gdzie będzie Cię już rekrutował ktoś kto sie na tym zna, no to już jakiś poziom musisz prezentować - statystyka/programowanie np w R itp.

Generalnie jak
  • Odpowiedz
@Luk_1mex: scikit będzie łatwiejszy na początek. To nie jest typowe rozpoznawanie znaków jak mnist z convnet, ale w sumie i lepiej (łatwiej). Wielowarstwowy perceptron i ogień. MLPClassifier szukaj.
  • Odpowiedz
Hej #datascience i #machinelearning!
W tym tygodniu artykuł nieco leniwy, ale myślę, że będzie szczególnie przydatny dla programujących w #jezykr.
W artykule omawiam całkiem ciekawy pakiet o nazwie auditor. Jeśli potrzebowałeś kiedyś porównać właściwości modeli predykcyjnych w R to będzie to narzędzie w sam raz dla Ciebie:

https://www.jakbadacdane.pl/pakiet-auditor-weryfikacja-walidacja-i-analiza-bledow-modelu-w-r/

#jakbadacdane
  • 16
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Hej,
Mirasy mam do Was pytanie dotyczące przyszłości data science w polsce.
Studiuje sobie infę, jestem na drugim roku. Do tej pory wiadomo, robiłem to co musiałem na uczelnię, a na własną rękę uczyłem się po trochu wielu rzeczy. Grzebałem trochę w froncie, nawet pare zleceń mi wpadło po znajomych i rodzinie. Uczyłem się trochę programowania pod Androida. Ale generalnie to nie dla mnie chyba. Od kilku miesięcy dokształcam się w kierunku
  • 12
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@ostry_ananas: Polecam dwie rzeczy:
1) zacznij pokazywać w sieci (blog, github, youtube, whatever), że masz pasję do danych
2) zastanów się nad szukaniem pracy zdalnej

Ścisłe wykształcenie bardzo pomaga. Ja pracuję jako Data Scientist za oceanem i za każdym raziem jak się przedstawie klientowi na początku projektu, że mam doktorat z fizyki to zaczynają słuchać co mam do powiedzenia.
  • Odpowiedz
Hej.
W tym tygodniu powróciłem do problemu jakości powietrza i próby określenia gdzie było najlepiej i najgorzej w 2017 roku w Polsce. Wyszło tak sobie i nie za bardzo mam pomysł jak to ugryźć :D. Zasadniczym problemem jest mała ilość oficjalnych punktów pomiarowych. Ale o tym już w artykule ;)

https://www.jakbadacdane.pl/jakosc-powietrza-w-polsce-2-rok-2017-oczami-oddychajacego-polaka/

#jakbadacdane #datascience
  • 5
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@Avitus:
Wydaje mi się, że potrzebujesz tak naprawdę dwóch statystyk, które będziesz potem analizował we wzajemnym kontekście - jakość powietrza oraz jakość danych.
W kwestii modelowania jakości powietrza, to u siebie stosujesz dość prostą metodę średniej ważonej, ja bym się zastanowił nad jakimś modelem "przestrzennym", modelującym też korelacje, jakiś model mieszany.
Jeżeli chodzi o modelowanie jakości danych, to jakaś prosta statystyka wynikająca z liczby dostępnych punktów i odległości.
Albo można
  • Odpowiedz
@lekkonieobecny: Wow, fajnie to wyszło. W sumie też mi się ten temat przewija cały czas w tle, ale nie ogarnąłem jeszcze na tyle heat map w Pythonie żeby było warto o tym pisać. A widziałem że faktycznie Tableau nieźle sprawdza się w takich wizualizacjach. Zdecydowanie też coś takiego muszę przygotować w Pythonie i w R ;)
  • Odpowiedz
Ahoj #datascience i #machinelearning. Wy to pewnie mnożycie macierze w bazach danych i inne cuda robicie. Ale może jest wśród was #newbie który jeszcze nie miał do czynienia z bazami danych. I właśnie z myślą o osobach początkujących napisałem artykuł w którym dzielę się moimi przemyśleniami na temat używania baz danych w projektach data science. Od razu ostrzegam, że temat jest na poziomie bardzo początkującym.
  • 3
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@ja_tu_czytam: Nie obrażam się ;). I mam pewien pomysł jak to ugryźć, ale jeszcze nie przetestowany - użyć modułu dask (https://dask.org/).
W samym artykule też piszę o tym, że możemy w ogóle nie zbudować ramki danych bo zabraknie nam pamięci ( ͡° ͜ʖ ͡°).

W sumie to jest to pomysł na artykuł na przyszłość. Może faktycznie w takiej sytuacji polegnę. Ale i tak będzie o
  • Odpowiedz