Takie użycie #datascience mnie urzeka - https://bost.ocks.org/mike/miserables/

Trzy rodzaje grupowania postaci:
- alfabetycznie
- po częstotliwości występowania w książce
- segmentami współwystępujących postaci

#statystyka #wizualizacja #ciekawostki #javascript #d3js #literatura #ksiazki bo "Nędznicy" :)

#whatadata – analiza i wizualizacja danych, statystyka, ciekawostki z półświatka Data Science ( ͡° ͜ʖ ͡°)
Dzisiaj zabawa z tagami :)

Na razie bez dostępu do wykopowego API, więc mogę skorzystać tylko z podstawowych informacji.
Otóż na głównej stronie mikrobloga #wykop pokazuje najpopularniejsze tematy, a po wejściu w wybrany tag widzimy te które są z nim powiązane.
Na podstawie powyższych informacji można stosunkowo łatwo utworzyć sieć relacji między tematami :) Kolejny krok to oczywiście wizualizacja danych, gdzie duże możliwości prezentuje biblioteka d3js #javascript

Postanowiłem użyć wykresu typu Chord
Pobierz w.....a - Dzisiaj zabawa z tagami :)

Na razie bez dostępu do wykopowego API, więc ...
źródło: comment_Wfmwymi0AWVmJuSXxvEZC7L4iwdSF5gX.gif
Jakie polecacie szkolenia z tematyki uczenia maszynowego i analityki danych? Mogą być ogólne jaki i tematyczne np. o sieciach neuronowych. Ważne że by było to szkolenie stacjonarne, a nie zdalne.


@blaze01: Miałem ćwiczenia z baz danych z jedną osób występujących jako wykładowca w http://datascience.ii.pw.edu.pl/bigdata.html#rada i mogę stwierdzić że były naprawdę dobre - miałem ten luksus oceniania projektu przez pryzmat praktyczności i doświadczeń z prawdziwych projektów, a nie "hehe, teraz zrobi pan
Było już o pięknie wizualizacji danych, pisałem też o konieczności jej stosowania. Dziś prostota i szybkość, w wersji bardzo praktycznej.

Excel w wersji 2010 i nowszych oferuje "Sparklines", co zostało przetłumaczone na mało romantyczne "Wykresy przebiegu w czasie" :) Oryginalna nazwa ładnie oddaje esencję funkcjonalności:
- łatwość wstawienia
- wizualną atrakcyjność
- minimalizm sprowadzony do linii (lub słupków)

Nie uświadczymy tu osi x/y, wartości liczbowych czy legendy. Mini-wykresy pozbawione są
Pobierz w.....a - Było już o pięknie wizualizacji danych, pisałem też o konieczności jej stos...
źródło: comment_plbcaFdu0ani6yTD4vh9QB3I47L12yLa.gif
@invtraveler Tableau w większości jest używane ponieważ jest intuicyjne i przyjazne dla użytkownika. PowerBI myślę, że szybko dogania Tableau ponieważ jest o wiele tańsze (aktualizacje masz cały czas za darmo w przeciwieństwie do Tableau a aktualizacje są ważne). W PowerBI piszesz w DAX czyli tak jak w excelu tyle, że operujesz na tabelach a nie rekordach (łatwo się przestawić). Patrząc na oferty pracy to najbardziej pożądany jest Tableau, na drugim miejscu jest
@invtraveler: najczęściej używany jest Excel :D Ja znam jeszcze Targita czy SQL Server Reporting Services (to ma dość spory udział) czy wizualizacje z R Servera/bibliotek pythonowych. No i są jeszcze te wszystkie technologie Sapowe. Polecam rzucić okiem na gartner bi quadrant coś w tym stylu.

@harris108: tak naprawdę ciężko stwierdzić, czy power bi będzie pierwsze. Ja bym się tak nie napalał, jeszcze dużo przed nim. Miesięczny model płatności per użytkownik
Po co nam wizualizacja danych? Czy liczby mówią same za siebie?
Znakomitą odpowiedź na oba pytania daje kwartet Anscombe’a.

Ten szczwany amerykański statystyk wymyślił w 1973 roku cztery różne zestawy danych - dla każdego po 11 par zmiennych x i y.
Statystyczne podsumowanie zestawów było identyczne do kilku miejsc po przecinku. W szczególności zbiory miały te same:
- średnie x, średnie y
- wariancje x, wariancje y
- współczynnik korelacji
Pobierz w.....a - Po co nam wizualizacja danych? Czy liczby mówią same za siebie?
Znakomitą ...
źródło: comment_W3aJ8168a0Hs0bIbhCtkAn4Gk8JFrX9a.jpg
Hej czy jest na wykopie ktoś kto na codzień zajmuje się analizą danych, czy też data science i używa głównie pythona? Szukam kogoś komu mogę odpłatnie zadawać różne pytania dotyczące wizualizacji danych w pythonie, bo sam stack overflow mi nie wystarcza, a jak sobie programuje to się tych pytań zbiera, a odpowiedzi na stacku nie ma. Mogę komuś płacić powiedzmy jak za konsultacje, z tym że potrzebuje kogoś kto faktycznie ogarnia to
#python #datascience #it #marketing #ecommerce

No XD! Marketing internetowy osiąga właśnie kolejne szczyty. Dostałem emaila od Team Anaconda, że dziękują za odwiedzenie ich stoiska na jakiejś konferencji (Gartner Data & Analytics Conference), i że dają mi pełną wersję książki (cośtam o data science). It was a pleasure to meet you. Stay in touch! i takie tam. Na konferencji oczywiście nie byłem, żadnego stoiska nie odwiedziałem, i za dwie godziny dostaję wiadomość: "Sorry
To zależy na jakim sprzęcie i - przede wszystkim - czy w ogóle o coś takiego chodzi, a nie np. tylko o jakieś statystyki ilości operacji na rekordach.
Python Data Science Handbook - Jake Vanderplas

http://shop.oreilly.com/product/0636920034919.do

Dostępna również w postaci ipynb (ipython notebooks)
https://github.com/jakevdp/PythonDataScienceHandbook

[OPIS]
Książka mogłaby się de facto nazywać "Wprowadzenie do ipython, numpy, pandas, matplotlib i scikit-learn". Ten jakże standardowy zestaw narzędzi każdego szanującego się (pythonowego) analityka danych (nie ma dobrego tłumaczenia na data scientist, więc to musi wystarczyć) jest doskonale w tej książce przedstawiony. Rzadko spotyka się tak koherentnie napisane książki. Praktycznie wszystko co się w książce