Wykop.pl Wykop.pl
  • Główna
  • Wykopalisko214
  • Hity
  • Mikroblog
  • Zaloguj się
  • Zarejestruj się
Zaloguj się

Popularne tagi

  • #ciekawostki
  • #informacje
  • #technologia
  • #polska
  • #swiat
  • #motoryzacja
  • #podroze
  • #heheszki
  • #sport

Wykop

  • Ranking
  • Osiągnięcia
  • FAQ
  • O nas
  • Kontakt
  • Reklama
  • Regulamin
Avitus

Avitus

Dołączył 15 lat i 1 mies. temu
  • Obserwuj
  • Akcje 104
  • Znaleziska 11
  • Mikroblog 93
  • Obserwujący 6
  • Obserwowane 17
  • Dodane (30)
  • Komentowane (45)
  • Plusowane (18)
Avitus
Avitus 26.03.2019, 08:23:44
  • 12
Hej, nie odzywałem się jakiś czas, ale wcale nie próżnowałem na #jakbadacdane. Opublikowałem w tym czasie kilka artykułów #datascience i #machinelearning, myślę więc, że jest dobrze ;-). Sądzę, że dla każdego znajdzie się coś ciekawego:

* https://www.jakbadacdane.pl/accuracy-precision-recall-f1-co-to-za-czary/ - Przegląd podstawowych metryk oceniających jakość modelu w klasyfikacji. Powinno rozjaśnić nieco temat dla początkujących.
* https://www.jakbadacdane.pl/dlaczego-warto-zainteresowac-sie-scikit-learn/ - Zaczynasz nową ścieżkę kariery albo po prostu projekt i
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

narowerzesamochodem
narowerzesamochodem
26.03.2019, 12:46:30
  • 1
@Avitus: klikłem, powodzenia!
  • Odpowiedz
Avitus
Avitus 27.02.2019, 09:50:50
  • 4
Hej!
W tym tygodniu przygotowałem krótki przykład jak używać modułu TA-Lib do wyznaczenia współczynników przydatnych w analizie technicznej. Może akurat komuś początkującemu w #python i #gielda się przyda:

https://www.jakbadacdane.pl/czy-mamy-tu-jakies-wrony-gpw-ml-2-ta-lib/

#jakbadacdane #datascience
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Avitus
Avitus 20.02.2019, 11:30:22
  • 9
Hej!
Jakby ktoś szukał pomysłu na ćwiczenie #sql dla początkujących to może mój najnowszy artykuł mu przypasuje:

https://www.jakbadacdane.pl/jakosc-powietrza-w-polsce-4-zrobmy-sobie-wlasna-baze-sqlite/

Miłego!
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Avitus
Avitus 06.02.2019, 12:14:38
  • 1
Hej.
Tym razem przygotowałem mały skrypt dla osób które chciały by ugryźć dane dzienne z GPW w Pythonie. Przy okazji dorzuciłem jeszcze prostą wizualizację w plotly. Miłego przeglądania:

https://www.jakbadacdane.pl/co-tam-na-gieldzie-slychac-gpw-ml-1/

#jakbadacdane
  • 2
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Kiv
Kiv
20.02.2019, 12:04:32
  • 0
@Avitus: taguj #analizadanych i #datascience. Szkoda, że dopiero teraz trafiłem na twoje posty ;)
  • Odpowiedz
Avitus
Avitus
Autor
20.02.2019, 12:11:24
  • 0
@Kiv: Czasem taguję #datascience, ale teraz uznałem, że było za mało nauki tam wiec sobie odpuściłem ;-). A co do postów to nic straconego, myślę że pojawi się tam jeszcze coś do czytania. No i jest też całe archiwum tam też przecież ;-P
  • Odpowiedz
Avitus
Avitus 23.01.2019, 14:06:54
  • 5
Hej #machinelearning i #datascience. Ostatnio po głowie chodził mi problem największego możliwego wpisanego okręgu w jakiś obszar zdefiniowany przez punkty na płaszczyźnie. Okazało się, że całkiem sprytnie można to rozwiązać za pomocą diagramów Woronoja. Jakby ktoś był zainteresowany, to zapraszam do artykułu:

https://www.jakbadacdane.pl/jakosc-powietrza-w-polsce-3-gdzie-brakuje-nam-czujnikow/

#jakbadacdane
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Avitus
Avitus 11.01.2019, 10:17:57
  • 3
Hej #datascience i #machinelearning!
Tym razem mam dla was artykuł wprowadzający w uczenie nienadzorowane. Temat trochę mniej "modny" niż uczenie nadzorowane, ale wydaje mi się, że nie mniej ciekawy. Zapraszam więc:

https://www.jakbadacdane.pl/analiza-skupien-na-przykladzie-algorytmu-k-srednich/

#jakbadacdane
  • 2
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

musialmi
musialmi
musialmi
11.01.2019, 21:00:09
  • 0
@Avitus: Co? Nienadzorowane jest modniejsze.
  • Odpowiedz
Avitus
Avitus
Autor
12.01.2019, 04:58:29
  • 0
@musialmi: Toś mi akurat skomentował/(a) najmniej chyba istoty element artykułu. Widziałem to AFAIR gdzieś w materiałach u Andrew Ng i on tego też za bardzo nie drążył. Może masz rację ¯\_(ツ)_/¯
  • Odpowiedz
Avitus
Avitus 04.01.2019, 09:20:09
  • 4
Hej #datascience i #machinelearning!
W tym tygodniu artykuł nieco leniwy, ale myślę, że będzie szczególnie przydatny dla programujących w #jezykr.
W artykule omawiam całkiem ciekawy pakiet o nazwie auditor. Jeśli potrzebowałeś kiedyś porównać właściwości modeli predykcyjnych w R to będzie to narzędzie w sam raz dla Ciebie:

https://www.jakbadacdane.pl/pakiet-auditor-weryfikacja-walidacja-i-analiza-bledow-modelu-w-r/

#jakbadacdane
  • 16
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

scyth
scyth
04.01.2019, 18:19:24 via iOS
  • 2
@grajlord: jest kilka firm wspierających R dla badań klinicznych - choćby Mango Solutions. Poza tym nawet sam SAS używa R. Najnowszy produkt SAS Data Mapper korzystał z kilku modułów R do trenowania AI, i wcale się z tym nie kryją.
scyth - @grajlord: jest kilka firm wspierających R dla badań klinicznych - choćby Man...

źródło: comment_XmyzmN3Hfo0Szy1HgEqgZc7JHLl8snE9.jpg

Pobierz
  • Odpowiedz
grajlord
grajlord
04.01.2019, 18:49:23
  • 1
@scyth: A to nie są przypadkiem Pythonowe moduły? ( ͡° ͜ʖ ͡°)
  • Odpowiedz
Avitus
Avitus 27.12.2018, 08:39:51
  • 2
Hej.
W tym tygodniu powróciłem do problemu jakości powietrza i próby określenia gdzie było najlepiej i najgorzej w 2017 roku w Polsce. Wyszło tak sobie i nie za bardzo mam pomysł jak to ugryźć :D. Zasadniczym problemem jest mała ilość oficjalnych punktów pomiarowych. Ale o tym już w artykule ;)

https://www.jakbadacdane.pl/jakosc-powietrza-w-polsce-2-rok-2017-oczami-oddychajacego-polaka/

#jakbadacdane #datascience
  • 5
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

grajlord
grajlord
27.12.2018, 11:46:26
  • 2
@Avitus:
Wydaje mi się, że potrzebujesz tak naprawdę dwóch statystyk, które będziesz potem analizował we wzajemnym kontekście - jakość powietrza oraz jakość danych.
W kwestii modelowania jakości powietrza, to u siebie stosujesz dość prostą metodę średniej ważonej, ja bym się zastanowił nad jakimś modelem "przestrzennym", modelującym też korelacje, jakiś model mieszany.
Jeżeli chodzi o modelowanie jakości danych, to jakaś prosta statystyka wynikająca z liczby dostępnych punktów i odległości.
Albo można
  • Odpowiedz
Avitus
Avitus
Autor
28.12.2018, 11:54:33
  • 1
@lekkonieobecny: Wow, fajnie to wyszło. W sumie też mi się ten temat przewija cały czas w tle, ale nie ogarnąłem jeszcze na tyle heat map w Pythonie żeby było warto o tym pisać. A widziałem że faktycznie Tableau nieźle sprawdza się w takich wizualizacjach. Zdecydowanie też coś takiego muszę przygotować w Pythonie i w R ;)
  • Odpowiedz
Avitus
Avitus 19.12.2018, 10:16:00
  • 5
Ahoj #datascience i #machinelearning. Wy to pewnie mnożycie macierze w bazach danych i inne cuda robicie. Ale może jest wśród was #newbie który jeszcze nie miał do czynienia z bazami danych. I właśnie z myślą o osobach początkujących napisałem artykuł w którym dzielę się moimi przemyśleniami na temat używania baz danych w projektach data science. Od razu ostrzegam, że temat jest na poziomie bardzo początkującym.
  • 3
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Avitus
Avitus
Autor
19.12.2018, 11:26:18
  • 0
@ja_tu_czytam: Nie obrażam się ;). I mam pewien pomysł jak to ugryźć, ale jeszcze nie przetestowany - użyć modułu dask (https://dask.org/).
W samym artykule też piszę o tym, że możemy w ogóle nie zbudować ramki danych bo zabraknie nam pamięci ( ͡° ͜ʖ ͡°).

W sumie to jest to pomysł na artykuł na przyszłość. Może faktycznie w takiej sytuacji polegnę. Ale i tak będzie o
  • Odpowiedz
ja_tu_czytam
ja_tu_czytam
19.12.2018, 12:03:49
  • 1
@Avitus: czekam na kontynuację ^^
  • Odpowiedz
Avitus
Avitus 12.12.2018, 13:26:42
  • 14
Ahoj #machinelearning i #datascience!. Czy są tutaj osoby początkujące? Specjalnie z myślą o was napisałem artykuł, w którym wypisuję i omawiam elementy projektu machine learning, które warto sobie przemyśleć i wybrać jeszcze przed rozpoczęciem pracy. Idea jest taka, że dzięki podjęciu tych decyzji, nawet osoba początkująca będzie miała szansę doprowadzić taki projekt do końca. Miłej lektury:

https://www.jakbadacdane.pl/jak-zaczac-dzialac-w-uczeniu-maszynowym/

#jakbadacdane
  • 7
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

caribbean
caribbean
12.12.2018, 13:41:17
  • 2
@Avitus: Melduję się

i biorę się za czytanie (。◕‿‿◕。)
  • Odpowiedz
Avitus
Avitus
Autor
16.12.2018, 17:39:40
  • 1
@sebek910: Dokładnie. Daj znać co Ci z tego wyjdzie ( ͡° ͜ʖ ͡°)
  • Odpowiedz
Avitus
Avitus 06.12.2018, 06:01:11
  • 2
Hej.
Tym razem przygotowałem krótki artykuł o module SHAP, który pozwala podejrzeć, dlaczego model dokonał takiej, a nie innej predykcji dla konkretnej obserwacji:

https://www.jakbadacdane.pl/co-to-jest-shapley-additive-explanations-shap/

Miłego czytania.
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Avitus
Avitus 28.11.2018, 13:03:48
  • 2
Hej. W tym tygodniu nie mam ani samouczka, ani eseju. Mam natomiast coś równie ciekawego. Powracam do mojego projektu z roku 2017, w którym zajmowałem się analizą jakości powietrza w Polsce. Jako że na powietrzu się zupełnie nie znam, podchodzę do tematu do strony danych. A, że GIOŚ trochę tych danych udostępnia, myślę, że będę miał w czym dłubać. Tymczasem zapraszam do pierwszego artykułu z serii:

https://www.jakbadacdane.pl/jakosc-powietrza-w-polsce-1-restart/

Miłego czytania!
#datascience
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Avitus
Avitus 21.11.2018, 05:12:42
  • 2
Hej #datascience i #machinelearning! W tym tygodniu przygotowałem dla was omówienie kolejnej po permutation importance metody dobierania się do modeli black box - partial dependence plots:

https://www.jakbadacdane.pl/partial-dependence-plots/

Mam nadzieję, że komuś się przyda. Miłej lektury! #jakbadacdane
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Avitus
Avitus 14.11.2018, 08:09:41
  • 3
Tym razem przygotowałem krótki post dla początkujących w #datascience. Wymiatacze nie muszą zaglądać, bo mowa jest o histogramach ;D

https://www.jakbadacdane.pl/histogramy/

Życzę miłego czytania
#jakbadacdane
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Avitus
Avitus 07.11.2018, 11:01:12
  • 4
Hej #datascience i #machinelearning!
W tym tygodniu chciałem się z wami podzielić prostą techniką oceniania przydatności kolumny w ramce danych za pomocą algorytmu permutation importance:

https://www.jakbadacdane.pl/eli5-i-czarne-pudelka/

Może być szczególnie przydatne przy sieciach neuronowych i składaniu
  • 2
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

erwit
erwit
09.11.2018, 07:49:26
  • 1
@Avitus: nie myslales o zalozeniu autorskiego taga?
  • Odpowiedz
Avitus
Avitus
Autor
14.11.2018, 07:45:23
  • 0
@erwit: Nie myślałem. Myślisz ma to sens?
  • Odpowiedz
Avitus
Avitus 06.11.2018, 09:23:16
  • 1
Hej #datascience. Natrafiłem właśnie na coś takiego: https://root.cern.ch/. Przyznam, że nigdy o tym nie słyszałem ani tym bardziej nie widziałem w akcji. Ktoś z was miał może z tym do czynienia i może w kilku zdaniach napisać o co kaman?
  • 4
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

dziobaki_sa_jadowite
dziobaki_sa_jadowite
dziobaki_sa_jadowite
14.11.2018, 09:25:36
  • 0
@Avitus: Może jak potrzebujesz coś zrobić i ma to koniecznie być w C, to tak. W stosunku do środowiska pythonowego, to strasznie toporny, słabe API, nieprzemyślana struktura, trochę kłopotów z zarządzaniem pamięcią.
  • Odpowiedz
Avitus
Avitus
Autor
14.11.2018, 09:32:00
  • 0
@dziobaki_sa_jadowite: Właśnie o to mniej więcej mi chodziło. Dzięki :)
  • Odpowiedz
Avitus
Avitus 31.10.2018, 07:40:35
  • 3
Hej #machinelearning i #datascience. Ostatnio trafiłem na moduł Pythonowy auto_ml. Pomyślałem sobie, że może to być fajna alternatywa dla tpot. Napisałem więc artykuł, w którym chciałem je dokładnie porównać. Ale z powodu bugów i słabej dokumentacji skończyło się tylko na ogólnym jego omówieniu. Myślę, że i tak może was zaciekawić:

https://www.jakbadacdane.pl/auto_ml-czyli-kolejny-modul-do-automatyzacji-uczenia-maszynowego/

Miłego czytania!
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Avitus
Avitus 24.10.2018, 13:48:07
  • 4
Hej #machinelearning i #datascience. Napisałem artykuł, w którym pokazuję pomysł, jak w prosty sposób można się pozbyć trochę danych, żeby nasz model trochę szybciej się trenował, nie tracąc przy tym zbyt dużo na jakość. Jeśli ktoś jest zainteresowany, to zapraszam do lektury.

https://www.jakbadacdane.pl/nieco-wiecej-o-pozbywaniu-sie-niepotrzebnych-danych/

Miłego czytania!
  • 2
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

sztilq
sztilq
24.10.2018, 14:00:29
  • 1
@Avitus: cóż, feature engineering to podstawa
  • Odpowiedz
Avitus
Avitus
Autor
24.10.2018, 14:28:39
  • 1
@sztilq: Tak, temat jeszcze będzie przeze mnie wałkowany wiele razy z różnych stron :)
  • Odpowiedz
Avitus
Avitus 20.10.2018, 07:34:29
  • 3
Treść przeznaczona dla osób powyżej 18 roku życia...
  • 47
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

L.....G
L.....G
konto usunięte 20.10.2018, 09:45:27
  • 2
@Avitus: @visez: sprzątanie powoduje u mnie że jakieś wolne myśli mi chodzą po głowie ;)

Otóż łatwo udowodnić, że bot rający tylko w headup nie jest podzbiorem bota grącego w 10 graczy.

Otóż, aby bot grający w 10 graczy doszedł do headup musi
  • Odpowiedz
ProfesorBigos
ProfesorBigos
23.10.2018, 17:36:27
  • 2
@Avitus: Sprawdź tę stronę http://www.computerpokercompetition.org/

Znajdziesz tam między innymi kod serwera do rozgrywek botów, który powinien być dużo wydajniejszy niż python. Oraz historie rozdań z rozgrywek innych botów, które można wykorzystać jako wiedzę ekspercka do wstępnego trenowania.
  • Odpowiedz
Avitus
Avitus 17.10.2018, 06:10:42
  • 9
Hej.
Tym razem napisałem artykuł, w którym spisuję garść moich przemyśleń na temat #machinelearning. Wymiatacze nie mają za bardzo czego tam szukać, ale początkującym może się to przydać.

https://www.jakbadacdane.pl/czym-wlasciwie-jest-machine-learning/

Zapraszam do lektury.
#datascience
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • <
  • 1
  • 2
  • Strona 1 z 2
  • >

Damian

  • https://www.jakbadacdane.pl/
  • X (dawny Twitter)

Osiągnięcia

  • Ekshibicjonista
    od 28.08.2018

    Ekshibicjonista
  • Rocznica
    od 21.10.2022

    Rocznica

Wykop © 2005-2025

  • O nas
  • Reklama
  • FAQ
  • Kontakt
  • Regulamin
  • Polityka prywatności i cookies
  • Hity
  • Ranking
  • Osiągnięcia
  • Changelog
  • więcej

RSS

  • Wykopane
  • Wykopalisko
  • Komentowane
  • Ustawienia prywatności

Regulamin

Reklama

Kontakt

O nas

FAQ

Osiągnięcia

Ranking