#datascience - strona 19

Wszystko

Najnowsze

Archiwum

07.05.2022, 15:17:31

#rlang #r #naukaprogramowania #datascience
Mam w R dataset, ktory w jednej kolumnie zawiera takie dane:
https://i.imgur.com/Xde3Diy.png

Chcę go spłaszczyć, co mogę zrobić w taki sposób
confessions$actions[[1]] ->

sokytsinolop

14.05.2022, 16:42:07

@heniek_8: przepisałem wszystko w pythonie z uzyciem pandasa, numpy i matplotliba i wszystkie moje problemy sie rozwiazaly :D strasznie ciezko sie polapac w tym R, mam wrazenie ze kazda biblioteka ma inny syntax

Utylizacja

14.05.2022, 18:33:08

@sokytsinolop: Też mam takie same wrażenia z używania R. Jakby ktoś wziął z Pythona list comprehension i zrobił z nich cały język.
Jak siedzisz w tym kilka lat to szybko się robi, ale jak nie znasz składni dokładnie na pamięć, to:
(1) ciężko jej się nauczyć (np. te wymiary tablicy [,,2]),
(2) nazwy funkcji są totalnie losowe (np. c to combine, a służy głównie do robienia wektorów albo apply, lapply,

HadakaJime

05.05.2022, 20:04:09

Może jest ktoś kto mógłby się podzielić opinią na temat studiów podyplomowych Big Data na pjatk, warto/ nie warto? Z góry dziękuję

https://pja.edu.pl/studia-podyplomowe-kursy/podyplomowe/big-data

#datascience

zzbkk

05.05.2022, 20:09:20 via Android

@HadakaJime ja mam średnia opinie o podyplomowece z analizy danych. Dobrze że to firma płaciła za to....
Mówili że będzie tak świetnie i super a przez dwa semestry j-----m na danych medycznych i badaniach leków bo takie mieli ,,dane" a okazało się że poprostu sylabus był z kierunku który dofinansowała UE tylko projekt się skończył to po co pod jakoś biznes przygotowywać materiały skoro mamy gotowe.

stonemerk

08.05.2022, 05:12:36 via Wykop Mobilny (Android)

@HadakaJime: ja się zastanawiałem na campem robionym przez Cormach analiza danych dla analitykowy.
Ale to prawie 10k podyplomowe teraz pewnie też podobnie.
Skończyło się na tym że pobrałem ich program i sam przerabiam ten materiał, nie wszystko da się za free znaleźć ale trochę udemy, trochę książek i myślę że ten materiał przerobię

Aryo

04.05.2022, 22:04:11

Treść przeznaczona dla osób powyżej 18 roku życia...

@Aryo: ¯\_(ツ)_/¯

Spotkałem się jakiś czas temu z opinią, że certyfikaty od AWS są bardzo mile widziane na rynku pracy, a tymczasem jak to wygląda z #azure? Mam DP-100, zapisałem się na DP-203 i się na to przygotowuje, ale wzięła mnie rozkmina czy tak naprawdę warto? #microsoft #programista15k #programowanie #cloud #datascience

WyjmijKija

03.05.2022, 17:22:23

@kijanu_riws: w tym momencie jest takie ssanie na rynku, że nie ma to znaczenia

GienekZFabrykiOkienek

03.05.2022, 18:09:51

@kijanu_riws: Ogólnie Microsoftowe certyfikaty zawsze miały słabe opinie - egzamin to tak naprawdę quiz z trivii o Mjakrosofcie i nie świadczy o praktycznych umiejętnościach.

porn

29.04.2022, 14:30:58

2145

Wizualizacja ponad 7 lat historii wykopu
Zrobiłem animację pokazującą jak zmieniała się popularność tagów na wykopie na przestrzeni lat. Popularność liczona jest jako łączna liczba wpisów na mirko oraz znalezisk, które użyły tagu w danym miesiącu. Animacja pokazuje 20 najpopularniejszych tagów w okresie od stycznia 2015 do teraz.

#ciekawostki #wykop #datascience #wizualizacjadanych

porn - Wizualizacja ponad 7 lat historii wykopu
Zrobiłem animację pokazującą jak zmi...

mateusz-bogacki

29.04.2022, 14:42:56

Treść przeznaczona dla osób powyżej 18 roku życia...

Bielecki

29.04.2022, 15:05:49

1468

@porn: danielmagical, patostreamy, kononowicz, bigbrother... to wiele mówi o tym portalu

Lawsuit

23.04.2022, 21:58:48 via Android

Czy jestesmy swiadkami polaczkuf spoznionych o 5 lat w pogoni za BIG MANEJ ktorzy rzucaja sie na #datascience?
Czy przewidujecie fale nadchodzaca na branze czy jednak dlugo nie dogoni standardowej developerki? ( ͡º ͜ʖ͡º)

#ai #ml #data #bigdata #sztucznainteligencja

peoplearestrange

24.04.2022, 15:57:43

@Lawsuit: przeciez to juz trwa od kilku lat, potem robia takie zaawansowane rzeczy jak w pic rel, a na wykopie doradzaja zeby sie nie pchac bez doktoratu z matematyki stosowanej ( ͡° ͜ʖ ͡°) i tak sie kreci kolo s----------a, aczkolwiek milo wejsc po pracy i poczytac pałowanie się dejta sajentystów, majac takich w pracy na wyciagniecie reki, widzac jak wyglada data science w p0lsce i

peoplearestrange - @Lawsuit: przeciez to juz trwa od kilku lat, potem robia takie zaa... — **źródło:** comment_1650815817c60mY1Ck9xGXf0G64cXWhU.jpg
Pobierz

Peptalk

26.04.2022, 13:16:48

@Lawsuit: Ja mam taka teorie o korpo w Polsce. W latach 90 kiedy korpo wchodziły do PL potrzebni byli ludzie od zarządzania. Nie musiałeś nic umieć, byle mieć papier i znac pokracznie ale wystarczająco angielski, żeby prowadzić w tym kraju sprzedaż produktów analitycznych wyprodukowanych za granica. Lata 00. to zapełnianie się korpo prawdziwymi kocurami, którzy z marszu byli head of analytics, head of data coś tam, aktuariuszami. Stanowisk było niewiele

Polski start-up oparty na AI zrewolucjonizuje wydarzenia sportowe!

ITKeyMedia hosts promising startups from Central & Eastern Europe that are just in the pre-Seed or pre-Series A stage of growth, often looking for investors to grow and scale their business.

z dodany: 23.04.2022, 14:19:22

varchar12

22.04.2022, 18:22:16

Witam was Mirki, mam pilne pytanie.
Czy kategoria "melanocytic nevi" ze zbioru danych HAM10000 to ta sama kategoria, albo podkategoria podobnej zmiany skórnej "Nevus" ze zbioru danych ISIC2020?
Pytam, ponieważ próbuję stworzyć klasyfikator rozróżniający różne zmiany skórne i się zastanawiam, czy rozdzielanie "melanocytic nevi" i "Nevus" na dwie kategorie ma sens. Po dodaniu ósmej kategorii(Nevus), do modelu parametr "accuracy" mocno spadł. Bez kategorii "Nevus" po jednym przejściu(1 epochs, 150 steps) klasyfikator uzyskiwał taki wynik:
loss:

masterix

23.04.2022, 11:10:47

@varchar12: nie znam, po prostu mnie zaciekawiłeś tematyką projektu, więc co z tym złego/dziwnego, że zadaję pytania?

varchar12

25.04.2022, 08:01:09

@masterix: Dzięki, zachęciłeś mnie aby wrzucić tutaj później ten projekt. Zamierzam we flasku dopisać do tego jakiś prosty interfejs i udostępnić w darmowej domenie, więc podeślę linka tutaj. Aktualnie mam spory problem z niezbalansowanymi danymi. W klasie liczącej najwięcej danych jest ich 6000 a w najmniejszej 100, co trochę psuje cały model. Poczytałem gdzieś, że dostosowanie wag mogło by w tej sytuacji pomóc. Ale nie pomaga. Zastosowałem tutaj automatyczne obliczenie

k.....9

konto usunięte 22.04.2022, 10:35:26

(Powtórka z odpowiednimi tagami)
Mirasy I Mirabelki:
Dajcie znać czy interesowało by was AMA z człowiekiem który sam się przebranżowił ze korpo klikacza enterów po kierunkach humanistycznych w Data Scientista?
Od 5 lata zajmuje się danymi, od ~2,5 roku pracuje jako DS

Każdy plusik uznaje za "Tak"
#ama #pracbaza #pracait #datascience #przebranzowienie

OrzechowyDzem

22.04.2022, 10:43:48

Od 5 lata zajmuje się danymi, od ~2,5 roku pracuje jako DS

@kingmidas89: sytuacja dla juniorów zmieniła się diametralnie względem ostatnich 5 lat, więc to co opowiesz i tak będzie nieaktualne ( ͡° ͜ʖ ͡°)

o.....k

konto usunięte 22.04.2022, 11:02:45

@kingmidas89: wołaj

rador314

21.04.2022, 14:32:52

Jest tu ktoś kto zmieniał całkowicie branże i poszedł w Data / Data science / Data engineering i chciałby opowiedzieć co i jak?

#it #sql #datascience #dataengineering #datascience

mam_Cie_na_strzala

21.04.2022, 14:36:24

@rador314: ale z jakiej branży chciałbyś przejść? Bo inaczej ma programista Python, inaczej programista Java, inaczej księgowy a jeszcze inaczej sprzedawca z Żabki

peoplearestrange

21.04.2022, 18:33:16

@rador314: data engineering i data science nie sa zbieżne

Naukowcy zapisali film w DNA bakterii.

Można go oczywiście z tego DNA odtworzyć. Użyto znanej technologii edycji genów CRISPR–Cas.

z dodany: 21.04.2022, 09:06:19

pustelnikk

20.04.2022, 21:48:16

Szukam obecnie materiałów do nauki modułów ML w Pythonie (sklearn, Tensorflow). Aspekt teorytyczny jest mile widziany, ale nie jest priorytetem, ponieważ mam od tego przedmiot na uczelni. Zależy mi na tym, aby było dużo praktyki i weryfikacji wiedzy - zadań lub projektów. Zna ktoś może odpowiednie książki/kursy/serie na YT? Osobiście znalazłem ze dwie/trzy sensownie wyglądające serie na youtube oraz dwie książki na PWN Uczenie maszynowe z użyciem Scikit-Learn i TensorFlow oraz Python

Dzięki!

@szczepan-szczypawa: Dzięki!

novak00

20.04.2022, 11:49:17

tak sobie czytam o balansowaniu danych i ciągle mi się przewija w tym temacie coś takiego jak metryki, czy jest mi w stanie ktoś wytłumaczyć o co w tym chodzi? dopiero raczkuję w temacie i myślałem, że do zbalansowania danych wystarczy użyć over/under-samplingu i wtedy mamy zrównoważony zbiór? po co stosuje się jakieś metryki potem? podrzucam linka do artykułu: https://metsi.github.io/2020/05/15/kod8.html #informatyka #algorytmy #datascience

damage49

20.04.2022, 12:16:09

@novak00: metryki to liczby które opisują jak (dobrze) działa model. W przypadku niezbalansownych danych wiele metryk daje mylące wartości (np. accuracy przy bezmyślnym strzelaniu w klasę dominująca może dawać wyniki 90%).

Automatyzacja w obszarze Machine Learning dzięki MLOps

W pewnym momencie trwania projektu ML trzeba przejść z eksperymentowania do wdrożenia. Czy takie przejście wykonywane jest tylko raz? Czy możemy automatyzować wdrażanie rozwiązania ML, od danych do wdrożonego rozwiązania? Czym jest MLOps i jak może nam pomóc automatyzować mądrze?

z dodany: 13.04.2022, 14:04:36

Peptalk

11.04.2022, 20:01:19

#datascience #zarobki #programista15k #korposwiat
Ile zarabia się teraz na midzie jako data scientist z 2-3 doświadczenia w branży w Warszawie. Chodzi mi o korpo typu Big4, banki, eCommerce. Powiedzmy ze w systemie UoP.

zrodzony_w_przegrywie

11.04.2022, 20:16:59

@Peptalk: 3100-5000 brutto polskich złotych

Abel11

11.04.2022, 20:33:00

@Peptalk: 21.37zł/h netto na fakturze

init5

10.04.2022, 11:01:22

Jaki kierunek studiów wybrać: matematykę czy informatykę, jeśli wiążę swoją karierę zawodową z Data Science? Mam wybór pomiędzy studiami informatycznymi na słabszych warszawskich uczelniach typu SGGW czy WAT, a studiami matematycznymi na MiNI PW lub MIMUW. Co mi da lepsze perspektywy w tej branży? Czy lepiej iść na słabszą uczelnię i uczyć się samemu czy starać się na dobrej uczelni? Olimpijczykiem nie jestem, więc też pytanie czy dam sobie radę na tych

T.....n

konto usunięte 10.04.2022, 11:03:08 via Android

@init5: Studia niczego nie uczą. Bierz informatykę, bo na matmie tylko zmarnujesz czas i będziesz mieć bezużyteczny dyplom okupiony godzinami nauki i wyrzeczeń.

peoplearestrange

10.04.2022, 14:23:34

@init5: matematyke. Predzej nauczysz sie kucowac jako matematyk niz kuca matematyki

Informatyka pod wzgledem jakosci to gowniane studia, nic z nich nie wyniesiesz

interpenetrate

05.04.2022, 20:14:30

Czy zostały wykonane kiedykolwiek, badania dotyczące prawdziwości tez astrologii?
No wiecie, to powinno w sumie być sprawdzalne, te tezy. Podaję przykład z brzegu:
Te rzekome ucharakteryzowania poszczególnych psychik sprawiają, że wyszczególnia się dobrze reagujące na siebie pary i źle.
Teoretycznie rzecz biorąc dane znaków zodiaku są wiadome - byłaby możliwość stwierdzenia czy np. wzorce się powtarzają w obiekcie testowym czyli populacji czy takie pary faktycznie się wyłaniają w istotnej liczbie. Czy te wzorce (patterny), się

@interpenetrate: tak, była testowana, nie działa: http://www.truthmagazine.com/archives/volume34/GOT034263.html

sidsfd

02.04.2022, 19:00:50 via Android

Znacie jakieś ciekawe czasopisma, blogi czy kanały, na których pojawiają się nowości ze świata #bigdata #machinelearning #datascience ?

peoplearestrange

02.04.2022, 19:22:23

@mk321: opowi pewnie chodzilo o cos w stylu towardsdatascience gdzie sa artykuly w stylu DLACZEGO NIE UZYWAC T-TESTU DLA PROB ZALEZNYCH a ty wyskakujesz z tematami o hipergraficznych sieciach neuronowych ( ͡° ͜ʖ ͡°)

szczepan-szczypawa

02.04.2022, 22:10:27

@sidsfd: Na twitterze społeczność DS/ML jest bardzo aktywna. Część z nich to autorzy książek, twórcy kursów itd. Ostatnio jest trochę syfu ze względu na wojnę i kilku gości odjechało od tematu, ale polecam kilka profili:
- fchollet
- aureliengeron
- pythonengineer
- omarsar0

interpenetrate

02.04.2022, 11:33:37

Jakie dane sobie znaleźć na necie i zestawić ze sobą, żeby sprawdzić gdzie młodzi ludzie mają najłatwiej z zakupem swojej nieruchomości?
Czyli to patrzeć wiek wyprowadzania się z domu? Czy patrzeć który kraj ma największą liczbę wniosków kredytowych bo wtedy jakby są pomiędzy tym że domu się nie da w ogóle kupić a tym że kupują za gotówkę i największą liczba o jak najmniejszym obciążeniu co do zarobków by świadczyła o tym

PandaCKratka

02.04.2022, 11:41:24 via iOS

@interpenetrate: Jeżeli chcesz sprawdzić strikte zakup to wyprowadzenie się z domu nie jest żadnym wyznacznikiem. Średnia pensja do średniej ceny na m2 mieszkania może być dobrym kierunkiem + poziom bezrobocia. Liczba wniosków kredytowych tez może być spoko odwołaniem.

Kiedysbedeczerwonka

02.04.2022, 11:56:00 via iOS

@interpenetrate: wołam @mickpl i @pastibox oni mają wszystkie analizy pod rękà

FrankLucas92

30.03.2022, 10:12:36

Czy te książki są nadal aktualne i można się z nich spokojnie uczyć?

1. Microsoft SQL Server 2016. Analysis Services. Modelowanie tabelaryczne Autor: Russo Marco , Ferrari Alberto

2. Podstawy języka T-SQL. Microsoft SQL Server 2016 i Azure SQL Database Autror: Ben-Gan Itzik

3.

kijanu_riws

05.04.2022, 09:40:06

A znacie może coś bardziej aktualnego? :) Chodzi mi o to czy to co jest w tyc książkach może mi się naprawdę przydać jako początkującemu, żebym się nie uczył jakiś starych głupot :D

@FrankLucas92: to jest książka na temat DAX a nie samego PowerBI. Książka jest jak najbardziej aktualna, szczerze polecam.

FrankLucas92

25.08.2022, 07:39:43

@Metylo: Tę akurat dostałem, ale odmówiłem, bo okazało się, że jednak miałbym tam robić coś innego, a jednak celuję konkretnie w pracę z BI, analiza danych. Ale miałem w tym tygodniu 3 inne rozmowy i teraz czekam na odpowiedź :D