@heniek_8: przepisałem wszystko w pythonie z uzyciem pandasa, numpy i matplotliba i wszystkie moje problemy sie rozwiazaly :D strasznie ciezko sie polapac w tym R, mam wrazenie ze kazda biblioteka ma inny syntax
  • Odpowiedz
@sokytsinolop: Też mam takie same wrażenia z używania R. Jakby ktoś wziął z Pythona list comprehension i zrobił z nich cały język.
Jak siedzisz w tym kilka lat to szybko się robi, ale jak nie znasz składni dokładnie na pamięć, to:
(1) ciężko jej się nauczyć (np. te wymiary tablicy [,,2]),
(2) nazwy funkcji są totalnie losowe (np. c to combine, a służy głównie do robienia wektorów albo apply, lapply,
  • Odpowiedz
  • 4
@HadakaJime ja mam średnia opinie o podyplomowece z analizy danych. Dobrze że to firma płaciła za to....
Mówili że będzie tak świetnie i super a przez dwa semestry j-----m na danych medycznych i badaniach leków bo takie mieli ,,dane" a okazało się że poprostu sylabus był z kierunku który dofinansowała UE tylko projekt się skończył to po co pod jakoś biznes przygotowywać materiały skoro mamy gotowe.
  • Odpowiedz
via Wykop Mobilny (Android)
  • 1
@HadakaJime: ja się zastanawiałem na campem robionym przez Cormach analiza danych dla analitykowy.
Ale to prawie 10k podyplomowe teraz pewnie też podobnie.
Skończyło się na tym że pobrałem ich program i sam przerabiam ten materiał, nie wszystko da się za free znaleźć ale trochę udemy, trochę książek i myślę że ten materiał przerobię
  • Odpowiedz
Treść przeznaczona dla osób powyżej 18 roku życia...
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Wizualizacja ponad 7 lat historii wykopu
Zrobiłem animację pokazującą jak zmieniała się popularność tagów na wykopie na przestrzeni lat. Popularność liczona jest jako łączna liczba wpisów na mirko oraz znalezisk, które użyły tagu w danym miesiącu. Animacja pokazuje 20 najpopularniejszych tagów w okresie od stycznia 2015 do teraz.

#ciekawostki #wykop #datascience #wizualizacjadanych
porn - Wizualizacja ponad 7 lat historii wykopu
Zrobiłem animację pokazującą jak zmi...
  • 175
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@Lawsuit: przeciez to juz trwa od kilku lat, potem robia takie zaawansowane rzeczy jak w pic rel, a na wykopie doradzaja zeby sie nie pchac bez doktoratu z matematyki stosowanej ( ͡° ͜ʖ ͡°) i tak sie kreci kolo s----------a, aczkolwiek milo wejsc po pracy i poczytac pałowanie się dejta sajentystów, majac takich w pracy na wyciagniecie reki, widzac jak wyglada data science w p0lsce i
peoplearestrange - @Lawsuit: przeciez to juz trwa od kilku lat, potem robia takie zaa...

źródło: comment_1650815817c60mY1Ck9xGXf0G64cXWhU.jpg

Pobierz
  • Odpowiedz
@Lawsuit: Ja mam taka teorie o korpo w Polsce. W latach 90 kiedy korpo wchodziły do PL potrzebni byli ludzie od zarządzania. Nie musiałeś nic umieć, byle mieć papier i znac pokracznie ale wystarczająco angielski, żeby prowadzić w tym kraju sprzedaż produktów analitycznych wyprodukowanych za granica. Lata 00. to zapełnianie się korpo prawdziwymi kocurami, którzy z marszu byli head of analytics, head of data coś tam, aktuariuszami. Stanowisk było niewiele
  • Odpowiedz
Witam was Mirki, mam pilne pytanie.
Czy kategoria "melanocytic nevi" ze zbioru danych HAM10000 to ta sama kategoria, albo podkategoria podobnej zmiany skórnej "Nevus" ze zbioru danych ISIC2020?
Pytam, ponieważ próbuję stworzyć klasyfikator rozróżniający różne zmiany skórne i się zastanawiam, czy rozdzielanie "melanocytic nevi" i "Nevus" na dwie kategorie ma sens. Po dodaniu ósmej kategorii(Nevus), do modelu parametr "accuracy" mocno spadł. Bez kategorii "Nevus" po jednym przejściu(1 epochs, 150 steps) klasyfikator uzyskiwał taki wynik:
loss:
  • 8
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@masterix: Dzięki, zachęciłeś mnie aby wrzucić tutaj później ten projekt. Zamierzam we flasku dopisać do tego jakiś prosty interfejs i udostępnić w darmowej domenie, więc podeślę linka tutaj. Aktualnie mam spory problem z niezbalansowanymi danymi. W klasie liczącej najwięcej danych jest ich 6000 a w najmniejszej 100, co trochę psuje cały model. Poczytałem gdzieś, że dostosowanie wag mogło by w tej sytuacji pomóc. Ale nie pomaga. Zastosowałem tutaj automatyczne obliczenie
  • Odpowiedz
(Powtórka z odpowiednimi tagami)
Mirasy I Mirabelki:
Dajcie znać czy interesowało by was AMA z człowiekiem który sam się przebranżowił ze korpo klikacza enterów po kierunkach humanistycznych w Data Scientista?
Od 5 lata zajmuje się danymi, od ~2,5 roku pracuje jako DS

Każdy plusik uznaje za "Tak"
#ama #pracbaza #pracait #datascience #przebranzowienie
  • 22
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Szukam obecnie materiałów do nauki modułów ML w Pythonie (sklearn, Tensorflow). Aspekt teorytyczny jest mile widziany, ale nie jest priorytetem, ponieważ mam od tego przedmiot na uczelni. Zależy mi na tym, aby było dużo praktyki i weryfikacji wiedzy - zadań lub projektów. Zna ktoś może odpowiednie książki/kursy/serie na YT? Osobiście znalazłem ze dwie/trzy sensownie wyglądające serie na youtube oraz dwie książki na PWN Uczenie maszynowe z użyciem Scikit-Learn i TensorFlow oraz Python
  • 11
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

tak sobie czytam o balansowaniu danych i ciągle mi się przewija w tym temacie coś takiego jak metryki, czy jest mi w stanie ktoś wytłumaczyć o co w tym chodzi? dopiero raczkuję w temacie i myślałem, że do zbalansowania danych wystarczy użyć over/under-samplingu i wtedy mamy zrównoważony zbiór? po co stosuje się jakieś metryki potem? podrzucam linka do artykułu: https://metsi.github.io/2020/05/15/kod8.html #informatyka #algorytmy #datascience
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@novak00: metryki to liczby które opisują jak (dobrze) działa model. W przypadku niezbalansownych danych wiele metryk daje mylące wartości (np. accuracy przy bezmyślnym strzelaniu w klasę dominująca może dawać wyniki 90%).
  • Odpowiedz
Jaki kierunek studiów wybrać: matematykę czy informatykę, jeśli wiążę swoją karierę zawodową z Data Science? Mam wybór pomiędzy studiami informatycznymi na słabszych warszawskich uczelniach typu SGGW czy WAT, a studiami matematycznymi na MiNI PW lub MIMUW. Co mi da lepsze perspektywy w tej branży? Czy lepiej iść na słabszą uczelnię i uczyć się samemu czy starać się na dobrej uczelni? Olimpijczykiem nie jestem, więc też pytanie czy dam sobie radę na tych
  • 12
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Czy zostały wykonane kiedykolwiek, badania dotyczące prawdziwości tez astrologii?
No wiecie, to powinno w sumie być sprawdzalne, te tezy. Podaję przykład z brzegu:
Te rzekome ucharakteryzowania poszczególnych psychik sprawiają, że wyszczególnia się dobrze reagujące na siebie pary i źle.
Teoretycznie rzecz biorąc dane znaków zodiaku są wiadome - byłaby możliwość stwierdzenia czy np. wzorce się powtarzają w obiekcie testowym czyli populacji czy takie pary faktycznie się wyłaniają w istotnej liczbie. Czy te wzorce (patterny), się
  • 5
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Jakie dane sobie znaleźć na necie i zestawić ze sobą, żeby sprawdzić gdzie młodzi ludzie mają najłatwiej z zakupem swojej nieruchomości?
Czyli to patrzeć wiek wyprowadzania się z domu? Czy patrzeć który kraj ma największą liczbę wniosków kredytowych bo wtedy jakby są pomiędzy tym że domu się nie da w ogóle kupić a tym że kupują za gotówkę i największą liczba o jak najmniejszym obciążeniu co do zarobków by świadczyła o tym
  • 5
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@interpenetrate: Jeżeli chcesz sprawdzić strikte zakup to wyprowadzenie się z domu nie jest żadnym wyznacznikiem. Średnia pensja do średniej ceny na m2 mieszkania może być dobrym kierunkiem + poziom bezrobocia. Liczba wniosków kredytowych tez może być spoko odwołaniem.
  • Odpowiedz
Czy te książki są nadal aktualne i można się z nich spokojnie uczyć?

1. Microsoft SQL Server 2016. Analysis Services. Modelowanie tabelaryczne Autor: Russo Marco , Ferrari Alberto

2. Podstawy języka T-SQL. Microsoft SQL Server 2016 i Azure SQL Database Autror: Ben-Gan Itzik

3.
  • 15
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

A znacie może coś bardziej aktualnego? :) Chodzi mi o to czy to co jest w tyc książkach może mi się naprawdę przydać jako początkującemu, żebym się nie uczył jakiś starych głupot :D


@FrankLucas92: to jest książka na temat DAX a nie samego PowerBI. Książka jest jak najbardziej aktualna, szczerze polecam.
  • Odpowiedz
@Metylo: Tę akurat dostałem, ale odmówiłem, bo okazało się, że jednak miałbym tam robić coś innego, a jednak celuję konkretnie w pracę z BI, analiza danych. Ale miałem w tym tygodniu 3 inne rozmowy i teraz czekam na odpowiedź :D
  • Odpowiedz