Mirki mam w #python funkcje 4 (hyper-)parametrow, w zasadzie bez zadnych constrainow, kotej wynikem jest score. Da sie to jakos ladniej zoptymializowac niz poprzed k-fold validation? Gradient liczyc? Na pewno sa jakies gotowe rozwiazania? #machinelearning #datascience
Hej! W tym tygodniu przygotowałem krótki przykład jak używać modułu TA-Lib do wyznaczenia współczynników przydatnych w analizie technicznej. Może akurat komuś początkującemu w #python i #gielda się przyda:
Hej. Tym razem przygotowałem mały skrypt dla osób które chciały by ugryźć dane dzienne z GPW w Pythonie. Przy okazji dorzuciłem jeszcze prostą wizualizację w plotly. Miłego przeglądania:
@Kiv: Czasem taguję #datascience, ale teraz uznałem, że było za mało nauki tam wiec sobie odpuściłem ;-). A co do postów to nic straconego, myślę że pojawi się tam jeszcze coś do czytania. No i jest też całe archiwum tam też przecież ;-P
Hej #machinelearning i #datascience. Ostatnio po głowie chodził mi problem największego możliwego wpisanego okręgu w jakiś obszar zdefiniowany przez punkty na płaszczyźnie. Okazało się, że całkiem sprytnie można to rozwiązać za pomocą diagramów Woronoja. Jakby ktoś był zainteresowany, to zapraszam do artykułu:
Hej #datascience i #machinelearning! Tym razem mam dla was artykuł wprowadzający w uczenie nienadzorowane. Temat trochę mniej "modny" niż uczenie nadzorowane, ale wydaje mi się, że nie mniej ciekawy. Zapraszam więc:
@musialmi: Toś mi akurat skomentował/(a) najmniej chyba istoty element artykułu. Widziałem to AFAIR gdzieś w materiałach u Andrew Ng i on tego też za bardzo nie drążył. Może masz rację ¯\_(ツ)_/¯
@Kura_Wasylisa: O niekoniecznie. R to wciąż potężny język, a cała masa nauki dzieje się właśnie tam. Dla kogoś kto używa tylko Pythona nie będzie to przydatne, ale jeśli sytuacja jest odwrotna to pakiet ten nagle zyskuje dużo na wartości. Zresztą, nie chodzi tu o sam kod, ale o pomysły które będą (zapewne) trafiać do auditora. Nikt przecież nikomu nie broni zrobić czegoś podobnego w Pythonie właśnie ;)
@Kura_Wasylisa: No ok, ale co np. z badaniami medycznymi? Biznes jest? Jest. Poważne ML jest? Jest. R jest? Jest. Oczywiście proporcje mogą być inne, a i medialnie brzmi to słabo. Czy z tego powodu jest to sztuka dla sztuki.
Ale nieważne, nie musimy tutaj chyba udowadniać swoich racji, bo wydaje mi się, że jeśli komuś to pomoże w rozwiązaniu jakiegoś ważnego problemu to już jest gites :).
Hej. W tym tygodniu powróciłem do problemu jakości powietrza i próby określenia gdzie było najlepiej i najgorzej w 2017 roku w Polsce. Wyszło tak sobie i nie za bardzo mam pomysł jak to ugryźć :D. Zasadniczym problemem jest mała ilość oficjalnych punktów pomiarowych. Ale o tym już w artykule ;)
@lekkonieobecny: Wow, fajnie to wyszło. W sumie też mi się ten temat przewija cały czas w tle, ale nie ogarnąłem jeszcze na tyle heat map w Pythonie żeby było warto o tym pisać. A widziałem że faktycznie Tableau nieźle sprawdza się w takich wizualizacjach. Zdecydowanie też coś takiego muszę przygotować w Pythonie i w R ;)
@grajlord: Myślę właśnie o modelowaniu czasoprzestrzennym, czyli oprócz uwzględnienia współrzędnych dołożyć do tego jeszcze informacje typu - godzina, dzień miesiąca, rok, dzień tygodnia, czy dzień jest świętem. Zobaczyć czy z tego da się coś wyczarować. A później dołożyć jeszcze informacje pogodowe: opady, ciśnienie, temperatura, wiatr. A jeżeli już będę miał takie modele, to mogę wtedy spojrzeć na dane z przyszłych lat. Tzn. wiele nowych czujników pojawia się z dnia na
@ja_tu_czytam: Nie obrażam się ;). I mam pewien pomysł jak to ugryźć, ale jeszcze nie przetestowany - użyć modułu dask (https://dask.org/). W samym artykule też piszę o tym, że możemy w ogóle nie zbudować ramki danych bo zabraknie nam pamięci ( ͡°͜ʖ͡°).
W sumie to jest to pomysł na artykuł na przyszłość. Może faktycznie w takiej sytuacji polegnę. Ale i tak będzie o
Ahoj #machinelearning i #datascience!. Czy są tutaj osoby początkujące? Specjalnie z myślą o was napisałem artykuł, w którym wypisuję i omawiam elementy projektu machine learning, które warto sobie przemyśleć i wybrać jeszcze przed rozpoczęciem pracy. Idea jest taka, że dzięki podjęciu tych decyzji, nawet osoba początkująca będzie miała szansę doprowadzić taki projekt do końca. Miłej lektury:
@sebek910: Siema. Tego akurat jeszcze nie wiem. Jeśli miałbym zgadywać, to powiedział bym, że pewnie tak, pytanie tylko po co? No bo jak już skalujemy wejście, to raczej po to, żeby operować tymi samymi rzędami wielkości. A różne skalery mogły bo to zepsuć. Nie?
@sebek910: Możliwe jest jak najbardziej, no bo robisz je w innym momencie niż trenowanie. Pytanie tylko czy np. jeśli wiek klienta będziesz skalował inaczej niż wiek nieruchomości to nie zepsujesz sobie danych ;)
Suicide bombing has become one of the most lethal and favorite modus operandi of terrorist organizations worldwide. Information technology and artificial intelligence have seen some tremendous advancement in recent years, and this study is set to use the power of data sciences and predictive analytics for counterterrorism and suicide bombings. This multidisciplinary research work outlines a theoretical framework for personal traumatization
@saif3r: Okładka i tytuł zalatuje trochę clickbaitem, ale kto wie, może coś sensownego piszą.
Zawsze mnie zastanawiało, jak statystycznie ugryźć taki temat. Ile jest rocznie bombiarzy samobójców? Czy kontekst za każdym razem jest inny, czy lecą taśmowo? Z chęcią przeczytał bym recenzję tej książki :)
Hej. Tym razem przygotowałem krótki artykuł o module SHAP, który pozwala podejrzeć, dlaczego model dokonał takiej, a nie innej predykcji dla konkretnej obserwacji:
Hej. W tym tygodniu nie mam ani samouczka, ani eseju. Mam natomiast coś równie ciekawego. Powracam do mojego projektu z roku 2017, w którym zajmowałem się analizą jakości powietrza w Polsce. Jako że na powietrzu się zupełnie nie znam, podchodzę do tematu do strony danych. A, że GIOŚ trochę tych danych udostępnia, myślę, że będę miał w czym dłubać. Tymczasem zapraszam do pierwszego artykułu z serii:
Hej #datascience i #machinelearning! W tym tygodniu przygotowałem dla was omówienie kolejnej po permutation importance metody dobierania się do modeli black box - partial dependence plots:
Hej #datascience. Natrafiłem właśnie na coś takiego: https://root.cern.ch/. Przyznam, że nigdy o tym nie słyszałem ani tym bardziej nie widziałem w akcji. Ktoś z was miał może z tym do czynienia i może w kilku zdaniach napisać o co kaman?
@dziobaki_sa_jadowite: Pewnie, nie planuję zamienić scikit-learn na to. Ciekawi mnie jednak, czy da się tego używać tylko w fizyce cząstek elementarnych, czy coś bardziej przyziemnego też da się tam wrzucić ;)
Da sie to jakos ladniej zoptymializowac niz poprzed k-fold validation? Gradient liczyc? Na pewno sa jakies gotowe rozwiazania? #machinelearning #datascience