Wszystko
Najnowsze
Archiwum
- 33
#kiciochpyta #analizadanych #datascience
- 2
#demografia #datascience
źródło: comment_vTeqEV6et6vGsjuI3ZPRcvKyJCPhp7fs.jpg
Pobierz525
Data is beautiful - Analiza gęstości zaludnienia na świecie

Mapy z nałożonymi słupkami które wskazują gęstość zaludnienia. Pozwala to uświadomić sobie jak nierówno ułożone jest zaludnienie w niektórych miejscach na świecie.
z- 61
- #
- #
- #
- #
- #
- #
- 363
Tutaj ta sama, ale interaktywna grafika z ponad 10 tys najlepszych filmów z ostatnich 118 lat
(Uwaga na skalę procentową po lewej)
#infog #statystyka #kultura #filmweb #netflix #filmdokumentalny #horror #musical #fantasy #komedia #thriller #analizadanych danych #datascience
źródło: comment_4e7go8iQrIk2gMwDbhNKfB1kUCZ1CPdQ.jpg
Pobierz- 82
GenreRelativePopularity
@cieliczka: ciekawe czemu filmy wojenne były tak popularne w okresie 1939-1945? Hm.. nie mogę połączyć wątków
źródło: comment_LolXqmvzS4X98eQQlOxivlwrFIRGDOLK.jpg
Pobierz- 0
conf.set(„spark.scheduler.mode”, „FAIR”)
ale nie dzieli po rowno xD to wina sparka czy ze cos jest zle ustawione?
#python #programowanie #datascience
- 0
- 0
spark faktycznie ustawia FAIR, ale „scheduling across applications” byl na domyslnych ustawieniach i bede musial zmienic, zeby np ustawic limit „core’ow” uzywanych przez jedna aplikacje
w dokumentacji pod „job scheduling” sa te informacje jakbyscie chcieli poczytac
#sgh #pjatk #datascience
- 3
Tym razem mam dla was artykuł wprowadzający w uczenie nienadzorowane. Temat trochę mniej "modny" niż uczenie nadzorowane, ale wydaje mi się, że nie mniej ciekawy. Zapraszam więc:
https://www.jakbadacdane.pl/analiza-skupien-na-przykladzie-algorytmu-k-srednich/
#jakbadacdane
Hej, słuchajcie mam takie pytanie. Jest tu jakiś absolwent Big Data na SGH i może podzielić się tym jak jest na rynku? Aktualnie studiuję BD na SGH i mam średnie odczucia. Czy jest sens to teraz rzucać i iść na jakąś informatykę ? Generalnie interesuje mnie głownie działka ML, hurtownie danych, cloud computing, czyli mniej analizy a więcej robienia. Myślałem,
Generalnie jak
- 1
koledzy pomocy. muszę napisać jakąś prostą sieć do tego? jak się za to zabrać żeby było łatwo i przyjemnie :D
TensorFlow, keras?
https://archive.ics.uci.edu/ml/datasets/letter+recognition
0
5 rzeczy, których (prawdopodobnie) nie wiedzieliście o Elasticsearch

Elasticsearch okazał się wydajną, nierelacyjną bazą danych, zorientowaną na wyszukiwanie pełnotekstowe w dużych, rozproszonych zbiorach dokumentów. Jednocześnie oferuje on szereg mechanizmów i rozwiązań, które mają bezpośredni wpływ na otrzymywane przez nas wyniki.
z- 2
- #
- #
- #
- #
- #
- #
- 4
W tym tygodniu artykuł nieco leniwy, ale myślę, że będzie szczególnie przydatny dla programujących w #jezykr.
W artykule omawiam całkiem ciekawy pakiet o nazwie auditor. Jeśli potrzebowałeś kiedyś porównać właściwości modeli predykcyjnych w R to będzie to narzędzie w sam raz dla Ciebie:
https://www.jakbadacdane.pl/pakiet-auditor-weryfikacja-walidacja-i-analiza-bledow-modelu-w-r/
#jakbadacdane
źródło: comment_XmyzmN3Hfo0Szy1HgEqgZc7JHLl8snE9.jpg
Pobierz- 1
Mirasy mam do Was pytanie dotyczące przyszłości data science w polsce.
Studiuje sobie infę, jestem na drugim roku. Do tej pory wiadomo, robiłem to co musiałem na uczelnię, a na własną rękę uczyłem się po trochu wielu rzeczy. Grzebałem trochę w froncie, nawet pare zleceń mi wpadło po znajomych i rodzinie. Uczyłem się trochę programowania pod Androida. Ale generalnie to nie dla mnie chyba. Od kilku miesięcy dokształcam się w kierunku
1) zacznij pokazywać w sieci (blog, github, youtube, whatever), że masz pasję do danych
2) zastanów się nad szukaniem pracy zdalnej
Ścisłe wykształcenie bardzo pomaga. Ja pracuję jako Data Scientist za oceanem i za każdym raziem jak się przedstawie klientowi na początku projektu, że mam doktorat z fizyki to zaczynają słuchać co mam do powiedzenia.
- 2
W tym tygodniu powróciłem do problemu jakości powietrza i próby określenia gdzie było najlepiej i najgorzej w 2017 roku w Polsce. Wyszło tak sobie i nie za bardzo mam pomysł jak to ugryźć :D. Zasadniczym problemem jest mała ilość oficjalnych punktów pomiarowych. Ale o tym już w artykule ;)
https://www.jakbadacdane.pl/jakosc-powietrza-w-polsce-2-rok-2017-oczami-oddychajacego-polaka/
#jakbadacdane #datascience
- 2
Wydaje mi się, że potrzebujesz tak naprawdę dwóch statystyk, które będziesz potem analizował we wzajemnym kontekście - jakość powietrza oraz jakość danych.
W kwestii modelowania jakości powietrza, to u siebie stosujesz dość prostą metodę średniej ważonej, ja bym się zastanowił nad jakimś modelem "przestrzennym", modelującym też korelacje, jakiś model mieszany.
Jeżeli chodzi o modelowanie jakości danych, to jakaś prosta statystyka wynikająca z liczby dostępnych punktów i odległości.
Albo można
- 1
- 5
- 0
W samym artykule też piszę o tym, że możemy w ogóle nie zbudować ramki danych bo zabraknie nam pamięci ( ͡° ͜ʖ ͡°).
W sumie to jest to pomysł na artykuł na przyszłość. Może faktycznie w takiej sytuacji polegnę. Ale i tak będzie o
1
Prognozowanie niedoskonałe, ale nieuniknione

Prognozy ekonomiczne są często błędne, dlatego można byłoby się zastanawiać, po co w ogóle je tworzyć. Głównym uzasadnieniem jest to, że większość uczestników rynku jest uzależnionych od przewidywań przyszłości. "Ludzie potrzebują opowieści i uzasadnień, a rynki zaczynają się niepokoić (...)"
z- 1
- #
- #
- #
- #
- #
- #
https://www.packtpub.com/packt/offers/free-learning
#packtpubfreelearning #python #machinelearning #datascience
źródło: comment_5tnvYV5cKCXxB597Itqi9fsbQGJvq5SM.jpg
Pobierz
















Za każdą poradę, artykuł będę wdzięczny
#naukaprogramowania #matplotlib #python #programowanie #datascience #analizadanych
źródło: comment_h2ZLA3oFnBhy4IiDT96JK0t47cwCGNXz.jpg
PobierzPo co Ci to w ogóle potrzebne? Dopasowujesz rozkład?