#datascience

Hej Mirki, tak sobie dlubie proste ETL w #pandas #numpy #python i glowkuje jak tu skrocic czas ladowania trzech duzych (1GB kazdy 900k x 200) CSV. Jedyne co przychodzi mi jeszcze do glowy to dorzucenie multiprocesingu bo duzo sie dzieje, z %pruna widze ze w tej chwili CPU jest waskim gardlem. Probowalem w prymitywny sposob zaladowac to w multi rozrzucajac kazdy plik na osobny
  • 13
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

bawił się ktoś może w robienie customowego monitoringu dla Airflow?
medytuję nad naklepaniem jakiegoś dashboarda który będzie zbierał statusy wykonania DAGów i pokazywał wszystko w jednym miejscu, tylko jeszcze nie wiem czy to sensowny pomysł (bo cuda niewidy pan hindus czasem robi z naszą instancją ) a nie jestem ownerem i nie chce mi się ręcznie klikać ( ͡° ͜ʖ ͡°)
czyli - jaaaaakby ktoś "been there done
  • 4
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Dodaję mirkowpis bo znalezisko nie dostało należytej uwagi, a mam do polecenia fantastyczny link dla wszystkich z #naukaprogramowania #machinelearning. Na https://today.bnomial.com/ codziennie publikowane jest jedno pytanie/historyjka w temacie sztucznej inteligencji/data science i jest to doskonałe uzupełnienie kursów o realne przypadki kiedy z modelem jest coś nie tak - z czego to może wynikać i jak spróbować to naprawić.

#programowanie #datascience #sztucznainteligencja
Networks_PowerCat - Dodaję mirkowpis bo znalezisko nie dostało należytej uwagi, a mam...

źródło: comment_16573896439cWMCG3lzH4GWsSRp0Lo08.jpg

Pobierz
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@Tasartico7: Żartujesz? Matematyki tylko trochę więcej niż na backendzie?
To jest jakaś opinia urwana z choinki.
W DS każdy algorytm oparty jest na matmie. Żeby zrozumieć najprostsze lasso już trzeba co nieco się orientować w matematycznych znaczkach. Już nie mówie o algorytmach pokroju sieci neuronowe czy transformery.

U mnie w firmie głownie przyjmują do działy analyst matematyków i później uczą ich programowania. Sam kończyłem bardziej informatyczny kierunek i teraz moją
  • Odpowiedz
Jakich pytań z #python mogę się spodziewać na rozmowie technicznej aplikując na mida data engineera? Jestem umówiony na już 2 rozmowy techniczne, na jednej ma być live coding głównie z Pythona i czuję przed nim stres (wiem czego mniej więcej się spodziewać po SQL'u i innych częściach).

Czy mam się spodziewać pytań o algorytmikę? Bo robię sobie zadanka na leetcode i mówiąc szczerze jestem sobą rozczarowany xD

#programista15k
  • 13
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@doctor07: to tez zalezy, wybierajac na przyklad sieci i cisco, uczysz sie z ksiazek i materialow wydanych przez cisco. Egzaminy z rozdzialow i w dniu labow, tez sa wykonywane w cisco academy, wiec w tym wypadku jakosc materialow jest na dosc wysokim poziomie.
  • Odpowiedz
@pustelnikk: też byłem tam z 8 lat temu i część techniczna rekrutacji wyglądała jak kolokwium. Dodałem kserówke z zadaniami. Jeszcze spotkanie z HRem, tylko nie takie łupie bezsensowne ale z psychologiem który ocenia czy będziesz dobrym szczurem w korpo. Nie dostałem się jakby co.
  • Odpowiedz
Daily reminder, że musicie być w rejestrze, żeby superkomputery z zaawansowanymi algorytmami analizowały wszystko co robicie. Nakierowywać na taki sam tok myślenia żeby być bardziej przewidywalnym, żeby profilować pod was reklamy, opierające się na psychice ludzkiej, waszych potrzebach akceptacji i instynktach. Które są tworzone przez ludzi którzy nawet by tego pewnie nie robili, gdyby nie było to trochę lepiej płatne, bo zostali zaprogramowani od wczesnych lat żeby to robić. I tak się
  • 8
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Udało mi się wreszcie lepiej zrozumieć jak efektywnie uczyć sieci typu GAN do generowania obrazów, więc postanowiłem podzielić się spostrzeżeniami i może oszczędzić komuś sporo czasu. Jak wiadomo ta architektura jest prawdopodobnie najtrudniejsza do debugowania a proces uczenia długi - no ale właśnie niekoniecznie. Jak się okazuje jednoczasowa propagacja wsteczna dla generatora i obu lossów dyskryminatora jest bardzo nieskuteczna. Lepiej rozbić to uczenie na 3 niezależne części - no ale wtedy czas
Bejro - Udało mi się wreszcie lepiej zrozumieć jak efektywnie uczyć sieci typu GAN do...

źródło: comment_1655938289GU2WRP43WYMF7A3scu6EUP.jpg

Pobierz
  • 8
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@Bejro: Nie byłem konkretny. Chodziło mi o WGAN-GP (tutaj nie clipujemy wag tylko mamy penalty na gradiencie, przez co zachowany jest warunek 1-Lipschitzowosci) który ma znacznie stabilniejszy proces uczenia od tego standardowego lossu który przytaczas. W praktyce tez nie stosuje sie częstszego treningu krytyka od generatora. Idea WGAN jest to, ze ta funkcja kosztu ma bardziej informacyjne gradienty przez co generator nawet jak się bardzo myli to może się poprawić
  • Odpowiedz
@ejsap_kupno: Hinge loss jest bardzo podobny do crossentropy z logitów więc to takie cofnięcie się do czegoś co działało od funkcji W. Generalnie WGAN-GP wciąż robi to samo co WGAN ale w inny (lepszy) sposób. Jeśli używamy dyskryminatora z dużym dropoutem na tym samym wygenerowanym batchu to wirtualnie próbkujemy większy rozkład i zwiększamy generalizację - a to coś innego niż zapobieganie zanikaniu gradientów w WGANach.
  • Odpowiedz
Mam w pracy taką analityczkę danych która wiecznie jest zajęta, ale jest skarbnicą wiedzy więc sytuacja mnie zmusza żeby czasem jej dupę zawrócić. Zawsze jak do niej zadzwonię to ona zaczyna "tylko mów szybko o co chodzi" - a jak uzyskam odpowiedź lub przekieruje mnie do innej osoby to nie mogę się z nią rozłączyć, bo coś p------i cały czas. wtf

#pracbaza #it #datascience
  • 3
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@Nxtp: ja kończyłem w tamtym roku. Jeśli nic się nie zmieniło, to studia są raczej skrojone pod osoby początkujące w analizie danych/data science. Nie oczekuj też, że ktoś tam będzie stał nad tobą z batem. Jeśli chcesz się nauczyć podstaw, to się nauczysz, jak nie to dostaniesz papier i tyle.
  • Odpowiedz
zamiast wywalac 6k to lepiej zatrudnij się w big data na juniora zwlaszcze ze juz jakies minimalne pojecie masz


Ciężko z tym będzie w Białym.

@Nxtp: Część wykładowców prowadziła mi zajęcia i są bardzo spoko. Jeśli 6k nie robi Ci wielkiej różnicy, a jesteś w stanie poświęcić wystarczająco dużo czasu, żeby pogłębiać to co pokażą na zajęciach to skorzystasz.

Zapisy kończą się chyba we wrześniu, a tu masz zagadnienia, które
  • Odpowiedz
Od zawsze dużo programuje. Co prawda w 90% były to sterowniki PLC oraz roboty przemysłowe. Po drodze liznąłem SQL przy różnych projektach. Sam uczę się pythona. Od jakiegoś czasu wujek google spamuje mnie kursem #datascience na #codecademy. Wykupiłem go sobie. Uzupełniam wiedzę o kursy z kaggle.
Jeszcze z pół roku, może rok i będę starał się o pierwszą pracę w tym kierunku. I teraz moje pytanie: będę
  • 3
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@kartofel: gdzie pracowałeś wczesniej i jaki biznes znasz od podszewki
Zrob model ktory coś w tym biznesie optymalizuje
Potem zacznij od tej samej branży jako guru od ds , z rozgladaniem się na boki oczywiście
  • Odpowiedz
@kartofel: Tematy IoT w automatyce to chyba dosyć ciekawy temat. Swego czasu robiłem wykrywanie anomalii dla dużej firmy na urządzenia raspberry. Teraz dużo pracujemy nad wizją komputerową na urządzeniach przenośnych - więc tematów jest mnóstwo. Wydaje mi się, że dobrze jest założyć github i w twoim przypadku zaczepić sie gdzieś w społeczności IoT i w tym ogarnąć jakieś projekty
  • Odpowiedz
@pustelnikk: Najważniejsze to przygotować się jak najlepiej ze swoich projektów. Jakich metod użyłeś, metryk, technologii, architektury. Jeśli użyłeś xgboosta to jak działa, co to gradient boosting, jak działają algorytmy drzewiaste. W ten sposób zrobisz lepsze wrażenie niż jakby rekruter miał cię odpytywać samemu.

Pamietam takie pytania z rozmów:
- jakie sa metryki (precision, recall, f1, auc, mse, map@k itp.),
- jakie są funkcje aktywacji (czym sie rozni relu od leaky relu, roznica miedzy
  • Odpowiedz
#anonimowemirkowyznania
Mirki chciałbym się przebranżowić ale z głową. Nie mam nic wspólnego z IT. Kiedyś bawiłem się w gimpie i jakieś obróki graficzne. Wiem mniej więcej co można robić w IT ale nie wiem co byłoby ciekawe dla mnie więc.. obecnie pracuje z excelem, różne ilości danych, różne raporty. Podoba mi się wyciąganie danych z nich, tworzeniem formuł, kombinowaniem jak je połączyć, jak znaleźć różnicę, itd. Podobaja mi się też
  • 13
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@AnonimoweMirkoWyznania: ucz sie Javy, Springa, Postgresa, Kafki, Terraforma, AWSa (SQS, SNS, DynamoDB), Kubernetes, Dockera, z frontu - React. Technologie - REST, OpenAPI.

Rob projekty na githubie, byle co, byle w tych technologiach. Pare pomysłów.
- sklep z rejestracją i obsługą stanów magazynowych
- Facebook bis
-
  • Odpowiedz
Widze te oferty pracy w branzy #it i sie zastanawiam, czy po 10 latach pracy w innej dziedzinie sie nie przebranzowic mam mgr inzyniera uprawnienia, i nie zarabiam nawet zblizonej sumy do pozycji ktorej proponuja stanowisko juniora
dzis widzialem oferte 13-19k dla junior data scientist.

#it #informatyka #datascience #inzynieria #praca #pracait
  • 10
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Mircy potrzebuje pobrac sobie tweety z danym slowem kluczowym/hastagiem z calego 2021 i 2020 roku.

Zalozylem sobie konto deweloperskie na twitterze ale niestety z tego co widze to zwykly darmowy dostep do ich API obejmuje tylko pobieranie tweetow z ostatnich 7 dni. Sa jakies plany premium i ewentualnie dostep uczelniany do celow resaerchowych.

I tutaj moje pytanie, czy ktos moze pobieral masowo tweety i zna jakis w miare dobry i tani sposob
  • 3
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

#anonimowemirkowyznania
W accenture widzie że jest ogłoszenie o zdalnej akademii z SQLa. Zakładam że po tym można dostać robotę jako junior DA czy coś w tym stylu. Czy ktoś wie czy przed tą akademią są jakieś testy, test analityczny czy też test z angielskiego? Brał ktoś udział w takiej akademii?
#pracait #pracbaza #analizadaych #datascience #programowanie #korposwiat #accenture

---
Kliknij
  • 6
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

OP: @kimikini:
Ten test przed akademią to jakiś test logiczno-matematyczny? Normalnie wysyłają linki sobie rozwiązuje na jakiejś platformie.
Angielski na poziomie B1 będzie git? Test też był online z angielskiego?
Rozmowa techniczna będzie przed akademią? Z opisu wynika że w zasadzie to jest skierowane do początkujących.
  • Odpowiedz
@AnonimoweMirkoWyznania: jak B1 moze byc git w miedzynarodowej firmie? bo jakos nie widze tego.
nie spotkalem sie z testami z angielskiego chyba nigdzie, po prostu czesto cala rozmowa lub część jest prowadzona po angielsku czesto w firmach.
zalezy ile umiesz ogolnie ale wiadomo ze nikogo zielonego nie beda brac ;d
  • Odpowiedz
@pustelnikk: Szczerze mówiąc gdybym był na początku, to powiedziałbym 3k z możliwością renegocjacji po 3 miesiącach. Jak po tym czasie i Ty i pracodawca uznacie że jest okej, to podwyżka do 4-4,5 i potem sukcesywnie idziesz w górę. Wydaje mi się to uczciwe
  • Odpowiedz