Hej, nie odzywałem się jakiś czas, ale wcale nie próżnowałem na #jakbadacdane. Opublikowałem w tym czasie kilka artykułów #datascience i #machinelearning, myślę więc, że jest dobrze ;-). Sądzę, że dla każdego znajdzie się coś ciekawego:

* https://www.jakbadacdane.pl/accuracy-precision-recall-f1-co-to-za-czary/ - Przegląd podstawowych metryk oceniających jakość modelu w klasyfikacji. Powinno rozjaśnić nieco temat dla początkujących.
* https://www.jakbadacdane.pl/dlaczego-warto-zainteresowac-sie-scikit-learn/ - Zaczynasz nową ścieżkę kariery albo po prostu projekt i zastanawiasz się, w jakie narzędzia zainwestować
@Kiv: Czasem taguję #datascience, ale teraz uznałem, że było za mało nauki tam wiec sobie odpuściłem ;-). A co do postów to nic straconego, myślę że pojawi się tam jeszcze coś do czytania. No i jest też całe archiwum tam też przecież ;-P
Hej #machinelearning i #datascience. Ostatnio po głowie chodził mi problem największego możliwego wpisanego okręgu w jakiś obszar zdefiniowany przez punkty na płaszczyźnie. Okazało się, że całkiem sprytnie można to rozwiązać za pomocą diagramów Woronoja. Jakby ktoś był zainteresowany, to zapraszam do artykułu:

https://www.jakbadacdane.pl/jakosc-powietrza-w-polsce-3-gdzie-brakuje-nam-czujnikow/

#jakbadacdane
@musialmi: Toś mi akurat skomentował/(a) najmniej chyba istoty element artykułu. Widziałem to AFAIR gdzieś w materiałach u Andrew Ng i on tego też za bardzo nie drążył. Może masz rację ¯\_(ツ)_/¯
Hej #datascience i #machinelearning!
W tym tygodniu artykuł nieco leniwy, ale myślę, że będzie szczególnie przydatny dla programujących w #jezykr.
W artykule omawiam całkiem ciekawy pakiet o nazwie auditor. Jeśli potrzebowałeś kiedyś porównać właściwości modeli predykcyjnych w R to będzie to narzędzie w sam raz dla Ciebie:

https://www.jakbadacdane.pl/pakiet-auditor-weryfikacja-walidacja-i-analiza-bledow-modelu-w-r/

#jakbadacdane
@Avitus:
Wydaje mi się, że potrzebujesz tak naprawdę dwóch statystyk, które będziesz potem analizował we wzajemnym kontekście - jakość powietrza oraz jakość danych.
W kwestii modelowania jakości powietrza, to u siebie stosujesz dość prostą metodę średniej ważonej, ja bym się zastanowił nad jakimś modelem "przestrzennym", modelującym też korelacje, jakiś model mieszany.
Jeżeli chodzi o modelowanie jakości danych, to jakaś prosta statystyka wynikająca z liczby dostępnych punktów i odległości.
Albo można wsiąknąć
@lekkonieobecny: Wow, fajnie to wyszło. W sumie też mi się ten temat przewija cały czas w tle, ale nie ogarnąłem jeszcze na tyle heat map w Pythonie żeby było warto o tym pisać. A widziałem że faktycznie Tableau nieźle sprawdza się w takich wizualizacjach. Zdecydowanie też coś takiego muszę przygotować w Pythonie i w R ;)
Ahoj #datascience i #machinelearning. Wy to pewnie mnożycie macierze w bazach danych i inne cuda robicie. Ale może jest wśród was #newbie który jeszcze nie miał do czynienia z bazami danych. I właśnie z myślą o osobach początkujących napisałem artykuł w którym dzielę się moimi przemyśleniami na temat używania baz danych w projektach data science. Od razu ostrzegam, że temat jest na poziomie bardzo początkującym. Ale jeśli będzie popyt to z
@ja_tu_czytam: Nie obrażam się ;). I mam pewien pomysł jak to ugryźć, ale jeszcze nie przetestowany - użyć modułu dask (https://dask.org/).
W samym artykule też piszę o tym, że możemy w ogóle nie zbudować ramki danych bo zabraknie nam pamięci ( ͡° ͜ʖ ͡°).

W sumie to jest to pomysł na artykuł na przyszłość. Może faktycznie w takiej sytuacji polegnę. Ale i tak będzie o czym
Ahoj #machinelearning i #datascience!. Czy są tutaj osoby początkujące? Specjalnie z myślą o was napisałem artykuł, w którym wypisuję i omawiam elementy projektu machine learning, które warto sobie przemyśleć i wybrać jeszcze przed rozpoczęciem pracy. Idea jest taka, że dzięki podjęciu tych decyzji, nawet osoba początkująca będzie miała szansę doprowadzić taki projekt do końca. Miłej lektury:

https://www.jakbadacdane.pl/jak-zaczac-dzialac-w-uczeniu-maszynowym/

#jakbadacdane
Hej. W tym tygodniu nie mam ani samouczka, ani eseju. Mam natomiast coś równie ciekawego. Powracam do mojego projektu z roku 2017, w którym zajmowałem się analizą jakości powietrza w Polsce. Jako że na powietrzu się zupełnie nie znam, podchodzę do tematu do strony danych. A, że GIOŚ trochę tych danych udostępnia, myślę, że będę miał w czym dłubać. Tymczasem zapraszam do pierwszego artykułu z serii:

https://www.jakbadacdane.pl/jakosc-powietrza-w-polsce-1-restart/

Miłego czytania!
#datascience #machinelearning #