Podcast który mi r------ł głowę. Programowanie probabilistyczne - Ben Vigoda - MIT Media Lab, twórca startupu tworzącego jedne z pierwszych procesorów zoptymalizowanych pod AI kupionego przez Darpe, jeden z liderów z programowania probabilistycznego

https://soundcloud.com/twiml/twiml-talk-033-ben-vigoda-power-probabilistic-programming

#datascience #siecineuronowe no i z #programowanie może kogoś zainteresuje
  • 2
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@matiit: spróbuję ale to jest wyjątkowo ciekawe mimo, że większości nie rozumiem. Czytam teraz o własnościach sieci neuronowych i o próbie ekstrakcji jakichś wzorów z nich może tam będzie coś równie dziwnego ;)
  • Odpowiedz
@neszwil: Umieć wczytać jakieś dane z csv przy pomocy numpy, zmodyfikować je nieco, może jakiś wykres w matplotlib (albo np. bokeh jak chcesz się pochwalić), policzyć jakieś wartości typu średnia, mediana, może jakąś średnią ruchomą (ale tu zaczynamy poza zielonkę wychodzić). Założenie jest takie, że chesz się nauczyć - oni chcą żebyś się douczył, a Ty pokazujesz, że się przygotowałeś.
  • Odpowiedz
Czy jest tu może osoba zajmująca się na co dzień tematyką związaną z #bigdata #datascience #machinelearning #analizadanych i mogłaby udzielić kilku wskazówek dla osoby dopiero wchodzącej w temat?

Od października zaczynam studia magisterskie na kierunki Big Data na SGH (inżyniera robiłem na zupełnie innym kierunku) i zastanawiam się jak najlepiej rozwijać się w tej branży. Z tego co wiem, na studiach będe miał możliwość poznania
  • 9
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@wytrzzeszcz: Czy tylko mi wydaje sie dziwne skok w magisterkę bez przygotowania?
@mam_Cie_na_strzala: Big data jest ścieżką opierającą się na analizie dużych wolumenów danych. Bardziej niż technologie ważniejsze jest zrozumienie procesów i technik umożliwiających składowanie i analizowanie dużej ilości danych. Po drodze pewno poznasz parę języków ( jak np python i go ) i narzędzi ( takich jak SQL, Hadoop .. ), ale nadal najważniejsze jest zrozumienie sposobów podejścia
  • Odpowiedz
@mam_Cie_na_strzala:

Generalnie data science to szerokie pojecie. W roznych firmach zatrudniaja DS i w ramach tej samej pozycji, zakres obowiazkow moze byc rozny (nawet w tej samej firmie). To co jest konieczne zeby byc DS to:
1. statystyka
2. SQL
3. znajomosc programowania - w stopniu pozwalajacym na samodzielne pisanie skryptow (Python
  • Odpowiedz
11 tygodni do całkowitego startu.

Minął tydzień, na razie powolutku do przodu, pierwsi chętni to zgłębiania tematyki już są.

Na razie, przed oficjalnym startem, na rozgrzewkę wrzucamy jakiś kurs #python bo jak by nie patrzeć, aktualnie #machinelearning, ogromna część to Python i R.
L.....G - 11 tygodni do całkowitego startu.


Minął tydzień, na razie powolutku do...

źródło: comment_GdMbyJJ1R6TNSolyN7apeQ1aXP1qSTRq.jpg

Pobierz
  • 3
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

jakiś poziom zaawansowania uczestniczących jest wymagany?


@boloney: No najlepiej jak ktoś coś tam ogarniał, chociaż w minimalnym stopniu, czy to miał pojęcie coś o programowaniu, czy też już coś z nazwijmy to data science ogólnie.

Aczkolwiek jak ktoś jest silnie zmotywowany i jest w miarę rozgarnięty, może i od zera, większość kursów (te które ruszymy za 10 tyg. będzie i tak leciała od podstaw (tylko różnie ludzie mogą myśleć co
  • Odpowiedz
Powyższy przykład ze skręcaniem w lewo naprawdę miał miejsce. W 2011 roku kierowcom UPS zasugerowano, aby w miarę możliwości unikali skrętów w lewo. Muszą wtedy ustępować pierwszeństwa, dłużej stać na skrzyżowaniach oraz wykonywać więcej niebezpiecznych zakrętów. Zamiast tego powinni możliwie często skręcać w prawo, korzystając z pierwszeństwa przejazdu. Nawet jeżeli nieznacznie wydłużali w ten sposób trasę do punktu docelowego.

-----
http://www.spidersweb.pl/2017/07/big-data-analiza-danych-data-science.html
-----

Korwin
  • 9
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@KombajnemPrzezUkraine: w stanach w zasadzie na każdym skrzyżowaniu możesz skręcić w prawo na czerwonym. Nie możesz tylko gdy jest zabronione (odwrotnie niż u nas) - w takim przypadku u kurierów faktycznie jest to OGROMNA różnica w czasie.
  • Odpowiedz
Z wakacyjnym pozdrowieniem - kolejny zestaw darmowych książek z zakresu #datascience #datamining #bigdata #python #jezykr #machinelearning #statystyka

http://www.learndatasci.com/free-data-science-books/

http://www.kdnuggets.com/2015/09/free-data-science-books.html

#whatadata – analiza i wizualizacja danych, statystyka, ciekawostki z półświatka Data Science ( ͡° ͜ʖ ͡°)
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@Snuffkin: a co z Coursera, dosyc dobre community mieli pare lat temu, teraz wiekszosc platna i dawno sie w nic nie angazowalem wiec nie wiem ile teraz ludzi tam sie uczy.
  • Odpowiedz
A gdyby tak badanie miejsca zbrodni zacząć od... kurzu?
Okazuje się, że bakterie w nim zawarte i ich proporcje mogą powiedzieć całkiem sporo o składzie osób przebywających w danym pomieszczeniu. Kobiety, mężczyźni, psy, koty - kogo więcej, kogo mniej?

Otwieramy w nowej karcie i sprawdzamy jakich dodatkowych lokatorów mamy w domu :)

#biologia #datascience #ciekawostki a przy okazji kolejna przyjemna #wizualizacja danych
w.....a - A gdyby tak badanie miejsca zbrodni zacząć od... kurzu?
Okazuje się, że ba...

źródło: comment_PyDtDWt5QfkWYkp086x790hKiMrWmelp.jpg

Pobierz
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Mirki co robię źle ?

a = c(aa = "111", cc = "222")
b = c(aa = "333", cc = "444")
l = list(a ,b)

Oczekuje kolumny aa z wartościami 111 oraz 333 a dostaję wiersz aa z tymi wartościami. Analogicznie w przypadku wiersza b
#rproject #datascience
  • 2
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

W październiku będę zaczynał trzeci rok metod ilościowych na SGH. Planuję wiązać swoją przyszłość zawodową z data science. Obecnie trochę forsuję rozwijanie twardych umiejętności na tym polu, poprzez uczenie się z zasobów internetowych. Przeglądając ofertę studiów II stopnia na SGH dotyczących analizy danych, wydaje mi się, że w tamtym czasie, większość rzeczy będę przerabiał po raz drugi, po przerobieniu ich już samodzielnie (zaczyna się to już dziać).

Ostatnio myślałem o magisterskich zagranicą, już
  • 24
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@Hayek: Słyszałeś o tym programie: http://kolegia.sgh.waw.pl/pl/KAE/struktura/KEI/oferta/Strony/qem.aspx? Generalnie skierowany jest do ludzi po MIESI(witam kolegę ;D) i polega to na tym, że przez pierwszy semestr uczysz się na esgiehu do testów i potem jeśli je dobrze napiszesz, wyjeżdzasz na 3 następne semestry na dwa z czterech uniwersystetów do wyboru: Paryż(Sorbona), Barcelona, Bielefeld i Wenecja. Kończysz wtedy magisterkę z podwójnym dyplomem SGH+QEM. Jedynym problemem jest to, że te miasta są dosyć
  • Odpowiedz
Mirki,
r script

library(lubridate)

mydates <- seq(ymd('2012-01-02'),ymd('2012-01-10'), by = 'days')
  • 5
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Wizualizacja i interaktywność danych. Plotly stworzyło bibliotekę do tworzenia interaktywnych wizualizacji w pythonie. Jest to coś na wzór tego co posiada R (Shiny). Plolty jest jedną z ładniejszych bibliotek do tworzenie interaktywnych wizualizacji, polecam zapoznać się się z galerią z linku numer 1, info z 2 + to co oferuje shiny w R link 3,4

1. https://plot.ly/dash/gallery
2. https://medium.com/@plotlygraphs/introducing-dash-5ecf7191b503
3. https://shiny.rstudio.com/gallery/
4. https://shiny.rstudio.com/articles/plot-interaction.html
  • 3
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Co myślicie o Inżynierii Danych na PG? ( ͡° ͜ʖ ͡°)
Wybiera się może ktoś? Jest to nowy kierunek, tylko 65 miejsc, trudno powiedzieć jaki będzie próg bo może być małe albo duże zainteresowanie, wielka niewiadoma. Na 90 % nie dostanę się na informatykę więc zostaje mi to albo elektronika i telekomunikacja. Jednak wolałbym trochę bardziej "informatyczny" kierunek. Ktoś się na to wybiera albo studiował coś podobnego na
  • 9
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@Namorzyny: w sum to wystarczy popatrzec na czlowieka i od razu widac czy nadaje sie na eti infe na przyklad czy nie, jak jest zadbany i sie usmiecha to pewnie bedzie robil inzyniera 10 lat ( ͡° ͜ʖ ͡°)
  • Odpowiedz
Potęga wizualizacji danych na przykładzie (darmowego!) oprogramowania Circos. Otwieramy w nowej karcie!

Nie będę się mądrzył na temat genomu, niech ktoś z #biologia #chemia się wypowie odnośnie przydatności takich rzeczy. Natomiast ilość upakowanych danych, relacji i powiązań jest moim zdaniem powalająca, a możliwe zastosowania szerokie.

Źródło - http://circos.ca/

#
w.....a - Potęga wizualizacji danych na przykładzie (darmowego!) oprogramowania Circo...

źródło: comment_YEwnPN1lRdzI0VFlpYR5KUmNmeg994oa.jpg

Pobierz
  • 4
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@whatadata Wygląda równie imponująco, co mało intuicyjnie na pierwszy rzut oka. W kwestii danych przedstawionych na tym wykresie to raczej fajna ciekawostka która dobrze prezentuje złożoność analizy danych którą można przeprowadzić na tym programie.
PS. Fajny tag z analizą danych, biorę do obserwowanych i czekam na kolejne ciekawostki ( ͡° ͜ʖ ͡°)
  • Odpowiedz
cześć Mirki z #datascience
czy zna ktoś może jakąś bibliotekę do języka R, która ułatwia pobieranie danych o kursach historycznych z NBP i/lub GPW?
A jeśli nie ma bibliotek, to czy ktoś zna może jakieś API do GPW, do którego dostęp nie wymaga rejestracji, tokenów itd?
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach