Szukam obecnie materiałów do nauki modułów ML w Pythonie (sklearn, Tensorflow). Aspekt teorytyczny jest mile widziany, ale nie jest priorytetem, ponieważ mam od tego przedmiot na uczelni. Zależy mi na tym, aby było dużo praktyki i weryfikacji wiedzy - zadań lub projektów. Zna ktoś może odpowiednie książki/kursy/serie na YT? Osobiście znalazłem ze dwie/trzy sensownie wyglądające serie na youtube oraz dwie książki na PWN Uczenie maszynowe z użyciem Scikit-Learn i TensorFlow oraz Python
  • 11
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

tak sobie czytam o balansowaniu danych i ciągle mi się przewija w tym temacie coś takiego jak metryki, czy jest mi w stanie ktoś wytłumaczyć o co w tym chodzi? dopiero raczkuję w temacie i myślałem, że do zbalansowania danych wystarczy użyć over/under-samplingu i wtedy mamy zrównoważony zbiór? po co stosuje się jakieś metryki potem? podrzucam linka do artykułu: https://metsi.github.io/2020/05/15/kod8.html #informatyka #algorytmy #datascience
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@novak00: metryki to liczby które opisują jak (dobrze) działa model. W przypadku niezbalansownych danych wiele metryk daje mylące wartości (np. accuracy przy bezmyślnym strzelaniu w klasę dominująca może dawać wyniki 90%).
  • Odpowiedz
Jaki kierunek studiów wybrać: matematykę czy informatykę, jeśli wiążę swoją karierę zawodową z Data Science? Mam wybór pomiędzy studiami informatycznymi na słabszych warszawskich uczelniach typu SGGW czy WAT, a studiami matematycznymi na MiNI PW lub MIMUW. Co mi da lepsze perspektywy w tej branży? Czy lepiej iść na słabszą uczelnię i uczyć się samemu czy starać się na dobrej uczelni? Olimpijczykiem nie jestem, więc też pytanie czy dam sobie radę na tych
  • 12
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Czy zostały wykonane kiedykolwiek, badania dotyczące prawdziwości tez astrologii?
No wiecie, to powinno w sumie być sprawdzalne, te tezy. Podaję przykład z brzegu:
Te rzekome ucharakteryzowania poszczególnych psychik sprawiają, że wyszczególnia się dobrze reagujące na siebie pary i źle.
Teoretycznie rzecz biorąc dane znaków zodiaku są wiadome - byłaby możliwość stwierdzenia czy np. wzorce się powtarzają w obiekcie testowym czyli populacji czy takie pary faktycznie się wyłaniają w istotnej liczbie. Czy te wzorce (patterny), się
  • 5
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Jakie dane sobie znaleźć na necie i zestawić ze sobą, żeby sprawdzić gdzie młodzi ludzie mają najłatwiej z zakupem swojej nieruchomości?
Czyli to patrzeć wiek wyprowadzania się z domu? Czy patrzeć który kraj ma największą liczbę wniosków kredytowych bo wtedy jakby są pomiędzy tym że domu się nie da w ogóle kupić a tym że kupują za gotówkę i największą liczba o jak najmniejszym obciążeniu co do zarobków by świadczyła o tym
  • 5
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@interpenetrate: Jeżeli chcesz sprawdzić strikte zakup to wyprowadzenie się z domu nie jest żadnym wyznacznikiem. Średnia pensja do średniej ceny na m2 mieszkania może być dobrym kierunkiem + poziom bezrobocia. Liczba wniosków kredytowych tez może być spoko odwołaniem.
  • Odpowiedz
Czy te książki są nadal aktualne i można się z nich spokojnie uczyć?

1. Microsoft SQL Server 2016. Analysis Services. Modelowanie tabelaryczne Autor: Russo Marco , Ferrari Alberto

2. Podstawy języka T-SQL. Microsoft SQL Server 2016 i Azure SQL Database Autror: Ben-Gan Itzik

3.
  • 15
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

A znacie może coś bardziej aktualnego? :) Chodzi mi o to czy to co jest w tyc książkach może mi się naprawdę przydać jako początkującemu, żebym się nie uczył jakiś starych głupot :D


@FrankLucas92: to jest książka na temat DAX a nie samego PowerBI. Książka jest jak najbardziej aktualna, szczerze polecam.
  • Odpowiedz
@Metylo: Tę akurat dostałem, ale odmówiłem, bo okazało się, że jednak miałbym tam robić coś innego, a jednak celuję konkretnie w pracę z BI, analiza danych. Ale miałem w tym tygodniu 3 inne rozmowy i teraz czekam na odpowiedź :D
  • Odpowiedz
#anonimowemirkowyznania
Pracuje na co dzień z SQL (T-SQL), oraz trochę z .NET od roku - to moja pierwsza praca.
Myśle nad rozwojem w kierunku #datascience
Warto w to iść? Jak jest z praca tak realnie? Co trzeba faktycznie umieć? Bo widzę pełno Pythona, jakoś SQL rzadko się przewija, z tego co widzę w ofertach. Jakieś porady, warto się w to pchać?

#programista15k chociaż ja jestem #programista7k15kjestdlazarzaduareczku
  • 10
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Warto w to iść? Jak jest z praca tak realnie? Co trzeba faktycznie umieć? Bo widzę pełno Pythona, jakoś SQL rzadko się przewija, z tego co widzę w ofertach. Jakieś porady, warto się w to pchać?


@AnonimoweMirkoWyznania: średnio, modna sprawa, dużo chętnych, szybko zmieniająca technologia. Lepiej (koszt wdrożenia do zarobków) idź w stock Azure i chmurowe serwisy do pracy z danymi. Migracje, optymalizacje, procesy ETL/ELT itp. Piszę to jako osoba
  • Odpowiedz
@arek-kukla: Chyba był na topie wśród pismaków, którzy tworzyli "listy zawodów na topie". Albo jeżeli przez "na topie" masz na myśli popularność wśród studentów. Przede wszystkim nie możesz przekładać 1:1 sytuacji w USA do sytuacji w Polsce, czy w ogóle w Europie, bo te rynki pracy wyglądają zupełnie inaczej i to nie jest tylko kwestia "paru lat różnicy", tylko po prostu systemowych różnic, u nas np. popularność języków programowania rozkłada
  • Odpowiedz
#anonimowemirkowyznania
Czy rynek dla DS i MLE jest rzeczywiście tak biedny, jak sugerują portale z ofertami typu Just Join IT czy No Fluff Jobs? Prawie nic dla juniorów, stawki mega przeciętne w porównaniu z resztą IT, oferty w stylu "minimum 5 lat doświadczenia na podobnym stanowisku, mile widziany doktorat z nauk ścisłych" z widełkami, które może rzucić crudziarz po bootcampie z 4-letnim doświadczeniem. O ile dobrze pamiętam, jeszcze 2 lata
  • 8
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@AnonimoweMirkoWyznania: Wydaję mi się, że firmy nie potrzebują już juniorów DS/MLE. Okazało się, że ML w notebookach to nie jest rozwiązywanie problemów biznesowych tylko zabawa. Co więcej, koszty zespołu DS rosną wykładniczo, wraz ze skomplikowaniem projektu. Nie wyobrażam sobie dać juniorowi zadanie do przygotowania modelu pod trening, który może kosztować nawet kilka tysięcy $. To samo tyczy się przygotowania danych, analizy, rozmowy z klientem i tak dalej.
Problem moim zdaniem jest
  • Odpowiedz
@Popcornn1: a czy można z licencjatem iść na podyplomowe? jeżeli tak, to zamiast się męczyć na jakimś zarządzaniu, zrobiłbyś coś np. ze statystyki (jeżeli chodzi o AI czy ML to pewnie studia w PL nie nadążają z programem, na kursach w necie znajdziesz świeższy kontent)
  • Odpowiedz
@Mordechai: w studiach matematycznych nie chodzi tyle o wiedzę czy konkretne zaawansowane metody co sposób myślenia, u mnie w firmie jest sporo osób nie po matmie (itp) i spokojnie dają sobie radę, ale Ci po matmie itp zdecydowanie odstają i szybciej awansują/dochodzą na wyżej w ścieżce kariery
  • Odpowiedz
@Mordechai: wal studia, no chyba ze jeszcze przy okazji chcesz zalapac kontakty czy cos. Dla myślącego pracodawcy liczy sie czy wprowadzasz jakis impact dla jego biznesu, masz potencjał rozwojowy.
Jesli pokazesz swoje projekty i dobrze je udokumentujesz, pokazesz ze wiesz co robisz to nie bedziesz mial problemu, no ale jak twoim glownym celem sa pieniadze to watpie czy bedziesz mial motywacje bo nauki jest duzo
  • Odpowiedz
Potrzebuje opinii kogoś bardziej doświadczonego jeśli chodzi o radzenie sobie z imbalanced data. Regresja logistyczna. Mam zbiór danych z 4000 wierszy (przed podziałem train test split) i w tym zbiorze jest tylko 16% wartości 1 wiec zbiór danych jest niezbalansowany. I tutaj mam pewne wątpliwości:

1.Czy metody SMOTE używamy przed podziałem zbioru na treningowy i testowy?
2.Co w przypadku gdy po upsamplingu SMOTE (zrobionym na zbiorze testowym) otrzymujemy dla modeli niższe accuracy niż bez
  • 4
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@srutownik: Zacznij od porządnej analizy danych a później weź sie za algorytmy klasyfikacji. Jeśli stwierdzisz w trakcie analizy, że dane są mało spójne tzn. posiadają dużo szum to musisz go usunąć i dopiero później stwiedzić czy potrzebujesz metod rozszerzania danych.
  • Odpowiedz
#machinelearning #deeplearning #webscraping #datascience #prawo
Mirki, czy wiecie jak obecnie w Polsce wygląda dokładnie prawo autorskie w kontekście gromadzenia treści na potrzeby naukowe? Mam konkretnie na myśli czy tworząc bazę danych obrazów (i ją nieodpłatnie udostępniając) w celu przetrenowania sieci nie łamię prawa? Czy na potrzeby akademickie jest to legalne? Co jeżeli bym gromadził zdjęcia z wyszukiwarek? Badał ktoś ostatnio taką kwestię?
  • 4
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@odrzutowakuchenka: Dziękuje za polecenia. Zamówiłam sobie Storytelling. Ale na ten show me the numbers też mam chrapkę - ale faktycznie, już dwie stówki trzeba wyłożyć. Zapisze sobie jako pomysł dla mnie ode mnie na prezent. ( ͡° ͜ʖ ͡°)
  • Odpowiedz