#it #programowanie #ekonometria #sgh #machinelearning #datascience
Wszystko
Wszystkie
Archiwum
717
Za ile wynająć mieszkanie? Ile zapłacić za wynajem?

Szczegółowa analiza z użyciem danych z internetowych serwisów ogłoszeniowych. Mnóstwo wykresów, do każdego dołączony kod źródłowy skryptu przetwarzającego dane.
z- 120
- #
- #
- #
- #
- #
- #
@jedrek1212: Wie ktoś może gdzie jest ładnie opisane jak zrobić model i predykcję ekonometryczną w #r. Model będzie zawierał wiele zmiennych
#it #programowanie #ekonometria #sgh #machinelearning #datascience
#it #programowanie #ekonometria #sgh #machinelearning #datascience
Dzisiaj zabawa z tagami :)
Na razie bez dostępu do wykopowego API, więc mogę skorzystać tylko z podstawowych informacji.
Otóż na głównej stronie mikrobloga #wykop pokazuje najpopularniejsze tematy, a po wejściu w wybrany tag widzimy te które są z nim powiązane.
Na podstawie powyższych informacji można stosunkowo łatwo utworzyć sieć relacji między tematami :) Kolejny krok to oczywiście wizualizacja danych, gdzie duże możliwości prezentuje biblioteka d3js #javascript
Postanowiłem użyć wykresu typu Chord
Na razie bez dostępu do wykopowego API, więc mogę skorzystać tylko z podstawowych informacji.
Otóż na głównej stronie mikrobloga #wykop pokazuje najpopularniejsze tematy, a po wejściu w wybrany tag widzimy te które są z nim powiązane.
Na podstawie powyższych informacji można stosunkowo łatwo utworzyć sieć relacji między tematami :) Kolejny krok to oczywiście wizualizacja danych, gdzie duże możliwości prezentuje biblioteka d3js #javascript
Postanowiłem użyć wykresu typu Chord
- shadowboxer
- toute-verte
- Felonious_Gru
- konto usunięte
- xDrope
- +26 innych
- 3
@whatadata: taka prawda, a im szybciej wejdzie w krew commitowanie zmian tym lepiej, wiem z doświadczenia ;)
- 3
Jakie polecacie szkolenia z tematyki uczenia maszynowego i analityki danych? Mogą być ogólne jaki i tematyczne np. o sieciach neuronowych. Ważne że by było to szkolenie stacjonarne, a nie zdalne.
#datascience #machinelearning #analizadanych #it #programowanie #bigdata
#datascience #machinelearning #analizadanych #it #programowanie #bigdata
- 3
Jakie polecacie szkolenia z tematyki uczenia maszynowego i analityki danych? Mogą być ogólne jaki i tematyczne np. o sieciach neuronowych. Ważne że by było to szkolenie stacjonarne, a nie zdalne.
@blaze01: Miałem ćwiczenia z baz danych z jedną osób występujących jako wykładowca w http://datascience.ii.pw.edu.pl/bigdata.html#rada i mogę stwierdzić że były naprawdę dobre - miałem ten luksus oceniania projektu przez pryzmat praktyczności i doświadczeń z prawdziwych projektów, a nie "hehe, teraz zrobi pan
- 0
@ntskj: Dzięki, ale studia podyplomowe jeszcze nie teraz, bardziej mnie interesuje jakieś szkolenie 5 dniowe czy coś takiego.
- 181
Było już o pięknie wizualizacji danych, pisałem też o konieczności jej stosowania. Dziś prostota i szybkość, w wersji bardzo praktycznej.
Excel w wersji 2010 i nowszych oferuje "Sparklines", co zostało przetłumaczone na mało romantyczne "Wykresy przebiegu w czasie" :) Oryginalna nazwa ładnie oddaje esencję funkcjonalności:
- łatwość wstawienia
- wizualną atrakcyjność
- minimalizm sprowadzony do linii (lub słupków)
Nie uświadczymy tu osi x/y, wartości liczbowych czy legendy. Mini-wykresy pozbawione są
Excel w wersji 2010 i nowszych oferuje "Sparklines", co zostało przetłumaczone na mało romantyczne "Wykresy przebiegu w czasie" :) Oryginalna nazwa ładnie oddaje esencję funkcjonalności:
- łatwość wstawienia
- wizualną atrakcyjność
- minimalizm sprowadzony do linii (lub słupków)
Nie uświadczymy tu osi x/y, wartości liczbowych czy legendy. Mini-wykresy pozbawione są
- 6
@whatadata: fajny bajer
@MalyBiolog: Nie umrze, tematyka jest obszerna, pomysłów nie brakuje, natomiast pewnym ograniczeniem jest formuła mikroblogowa. O niektórych sprawach warto byłoby zrobić całe filmiki, kto wie jak to się skończy :)
@czlapka: Będą kolejne, następnym powinien być krótki pokaz jak statystyka może działać na rzecz literatury pięknej :)
@czlapka: Będą kolejne, następnym powinien być krótki pokaz jak statystyka może działać na rzecz literatury pięknej :)
Pytanko do mirków specjalistów z data analytics, które programy do wizualizacji danych są najczęsciej używane w branży, Tablueau, Qlikview, Power BI, d3.js, bokeh? Ew. co jest najbardziej pożądane teraz od nowicjuszy wchodzących w to?
#datascience #dataisbeautiful
#datascience #dataisbeautiful
@invtraveler Tableau w większości jest używane ponieważ jest intuicyjne i przyjazne dla użytkownika. PowerBI myślę, że szybko dogania Tableau ponieważ jest o wiele tańsze (aktualizacje masz cały czas za darmo w przeciwieństwie do Tableau a aktualizacje są ważne). W PowerBI piszesz w DAX czyli tak jak w excelu tyle, że operujesz na tabelach a nie rekordach (łatwo się przestawić). Patrząc na oferty pracy to najbardziej pożądany jest Tableau, na drugim miejscu jest
@invtraveler: najczęściej używany jest Excel :D Ja znam jeszcze Targita czy SQL Server Reporting Services (to ma dość spory udział) czy wizualizacje z R Servera/bibliotek pythonowych. No i są jeszcze te wszystkie technologie Sapowe. Polecam rzucić okiem na gartner bi quadrant coś w tym stylu.
@harris108: tak naprawdę ciężko stwierdzić, czy power bi będzie pierwsze. Ja bym się tak nie napalał, jeszcze dużo przed nim. Miesięczny model płatności per użytkownik
@harris108: tak naprawdę ciężko stwierdzić, czy power bi będzie pierwsze. Ja bym się tak nie napalał, jeszcze dużo przed nim. Miesięczny model płatności per użytkownik
- 9
Zbiór ciekawych materiałów z AI/ML
https://hackernoon.com/index-of-best-ai-machine-learning-resources-71ba0c73e34d
#datascience #machinelearning
https://hackernoon.com/index-of-best-ai-machine-learning-resources-71ba0c73e34d
#datascience #machinelearning
Po co nam wizualizacja danych? Czy liczby mówią same za siebie?
Znakomitą odpowiedź na oba pytania daje kwartet Anscombe’a.
Ten szczwany amerykański statystyk wymyślił w 1973 roku cztery różne zestawy danych - dla każdego po 11 par zmiennych x i y.
Statystyczne podsumowanie zestawów było identyczne do kilku miejsc po przecinku. W szczególności zbiory miały te same:
- średnie x, średnie y
- wariancje x, wariancje y
- współczynnik korelacji
Znakomitą odpowiedź na oba pytania daje kwartet Anscombe’a.
Ten szczwany amerykański statystyk wymyślił w 1973 roku cztery różne zestawy danych - dla każdego po 11 par zmiennych x i y.
Statystyczne podsumowanie zestawów było identyczne do kilku miejsc po przecinku. W szczególności zbiory miały te same:
- średnie x, średnie y
- wariancje x, wariancje y
- współczynnik korelacji
Hej czy jest na wykopie ktoś kto na codzień zajmuje się analizą danych, czy też data science i używa głównie pythona? Szukam kogoś komu mogę odpłatnie zadawać różne pytania dotyczące wizualizacji danych w pythonie, bo sam stack overflow mi nie wystarcza, a jak sobie programuje to się tych pytań zbiera, a odpowiedzi na stacku nie ma. Mogę komuś płacić powiedzmy jak za konsultacje, z tym że potrzebuje kogoś kto faktycznie ogarnia to
@whiterose: Ok będę pisał
@invtraveler
Pracuje na codzien z BigData. Głównie python
Pracuje na codzien z BigData. Głównie python
Mirki, czy znacie jakieś firmy związane z #bigdata #datascience #analizadanych #statystyka z Krakowa, które prowadzą jakieś praktyki\staże? Albo do któych można się zwrócić? Bo jak zawsze czegoś szukam to tylko Wrocław i Wrocław. Albo jakiś Ślunsk.
konto usunięte via Android
- 1
Za pomocą MapReduce'a chce przekształcić plik csv (by dało to co pandas.unstack(), zmiana formatu tabeli z "szerokiego" na "wąską i długą"), napisałem prosty mapper i reducer, działa, tylko że wiersze w wyniku są oddzielone pustymi liniami.
Jak można to tak zredukować, żeby otrzymać plik a'la csv, bez pustych linii?
#hadoop #python #programowanie #datascience
Jak można to tak zredukować, żeby otrzymać plik a'la csv, bez pustych linii?
#hadoop #python #programowanie #datascience
- 5
@krolikbartek: biorąc pod uwagę ile kodu pokazałeś to mogę ci tylko doradzić abyś przestał zapisywać puste linie do pliku ( ͡° ͜ʖ ͡°)
- 2
@krolikbartek: https://ideone.com/fL88AF
wejście zawiera nowe linie, więc jak nie chcesz ich na wyjściu to musisz je usunąć, na przykład z pomocą line.strip()
wejście zawiera nowe linie, więc jak nie chcesz ich na wyjściu to musisz je usunąć, na przykład z pomocą line.strip()
- 10
#python #datascience #it #marketing #ecommerce
No XD! Marketing internetowy osiąga właśnie kolejne szczyty. Dostałem emaila od Team Anaconda, że dziękują za odwiedzenie ich stoiska na jakiejś konferencji (Gartner Data & Analytics Conference), i że dają mi pełną wersję książki (cośtam o data science). It was a pleasure to meet you. Stay in touch! i takie tam. Na konferencji oczywiście nie byłem, żadnego stoiska nie odwiedziałem, i za dwie godziny dostaję wiadomość: "Sorry
No XD! Marketing internetowy osiąga właśnie kolejne szczyty. Dostałem emaila od Team Anaconda, że dziękują za odwiedzenie ich stoiska na jakiejś konferencji (Gartner Data & Analytics Conference), i że dają mi pełną wersję książki (cośtam o data science). It was a pleasure to meet you. Stay in touch! i takie tam. Na konferencji oczywiście nie byłem, żadnego stoiska nie odwiedziałem, i za dwie godziny dostaję wiadomość: "Sorry
- lubie-sernik
- venomik
- konto usunięte
- ppawel
- gallagher
- +5 innych
- 0
@miszo_balkan: Sam pdf raczej bez większej wartości, jakby ktoś jeszcze nie otworzył. Ja naiwnie dopuszczam, że się jednak pomylili.
48
Wizualne wprowadzenie do Uczenia Maszynowego [Machine Learning]
![Wizualne wprowadzenie do Uczenia Maszynowego [Machine Learning]](https://wykop.pl/cdn/c3397993/link_Uz9Oyczh79aG6IJqv6MrlNuWCsiqz2X9,w220h142.jpg)
- Dodaj Komentarz
- #
- #
- #
- #
- #
- #
Mircy, powiedzcie proszę, na jaką płacę mogę liczyć w dużej korporacji w Wwie jako praktykant w dziedzinie AI, ML?
#datascience #praca #machinelearning #programowanie
#datascience #praca #machinelearning #programowanie
@Piz-dur: jako praktykant dopłacasz korporacji za możliwość pracy u nich
- 1
Komentarz usunięty przez autora
6
Średnia długość życia w 2030 roku wyniesie 90 lat

Kobiety z Korei Południowej będą pierwszą populacją na świecie, której średnia długość życia przekroczy 90 lat. Oto prognozy długości życia w 35 krajach.
z- Dodaj Komentarz
- #
- #
- #
- #
- #
- #
Jakie podejście można zastosować przy analizie czasu życia rekordu (jego zmian na przestrzeni czasu). Timestampy to pierwsze co przychodzi na myśl ale może jest jakieś podejście, które pomoże mi rozwiązać ten problem w sposób sprawdzony i cywilizowany. halp
#bazydanych #analiza #datascience
#bazydanych #analiza #datascience
@w__k: scd nada się dla milionów rekordów by można było potem je poagregować i wizualizować?
- 0
To zależy na jakim sprzęcie i - przede wszystkim - czy w ogóle o coś takiego chodzi, a nie np. tylko o jakieś statystyki ilości operacji na rekordach.
4
Autonomous driving w domowym zaciszu :)

Zeby rozpoczac przygode z autonomous driving, nie potrzeba nakladow finansowych, lub gigantycznej mocy obliczeniowej. Aby potwierdzic te teze napisalem, krotki artykul prezentujacy sposoby pozwalajace na dolaczenie do swiata "samojezdnych samochodow" - bez opuszczania domowego zacisza. Enjoy! :)
z- Dodaj Komentarz
- #
- #
- #
- #
- #
- #
- 4
ekipa z #bigdata i #datascience - wiecie, czy i jezeli tak, to gdzie sa otwarte facebookowe datasety?
#niemogespaciwyszukujeroznebzdury
#niemogespaciwyszukujeroznebzdury
- 21
Python Data Science Handbook - Jake Vanderplas
http://shop.oreilly.com/product/0636920034919.do
Dostępna również w postaci ipynb (ipython notebooks)
https://github.com/jakevdp/PythonDataScienceHandbook
[OPIS]
Książka mogłaby się de facto nazywać "Wprowadzenie do ipython, numpy, pandas, matplotlib i scikit-learn". Ten jakże standardowy zestaw narzędzi każdego szanującego się (pythonowego) analityka danych (nie ma dobrego tłumaczenia na data scientist, więc to musi wystarczyć) jest doskonale w tej książce przedstawiony. Rzadko spotyka się tak koherentnie napisane książki. Praktycznie wszystko co się w książce
http://shop.oreilly.com/product/0636920034919.do
Dostępna również w postaci ipynb (ipython notebooks)
https://github.com/jakevdp/PythonDataScienceHandbook
[OPIS]
Książka mogłaby się de facto nazywać "Wprowadzenie do ipython, numpy, pandas, matplotlib i scikit-learn". Ten jakże standardowy zestaw narzędzi każdego szanującego się (pythonowego) analityka danych (nie ma dobrego tłumaczenia na data scientist, więc to musi wystarczyć) jest doskonale w tej książce przedstawiony. Rzadko spotyka się tak koherentnie napisane książki. Praktycznie wszystko co się w książce
- lkp0
- Iwangelion
- luki_sk
- lubii
- Styrmir
- +16 innych
- 1
- 1
@invtraveler: To jest ta sama książka tylko po prostu taki format.
Po lewej notatnik, po prawej pdf.
Po lewej notatnik, po prawej pdf.



















Trzy rodzaje grupowania postaci:
- alfabetycznie
- po częstotliwości występowania w książce
- segmentami współwystępujących postaci
#statystyka #wizualizacja #ciekawostki #javascript #d3js #literatura #ksiazki bo "Nędznicy" :)
#whatadata – analiza i wizualizacja danych, statystyka, ciekawostki z półświatka Data Science ( ͡° ͜ʖ ͡°)