Wpis z mikrobloga

Od kilku lat obserwuję w branży (nazwijmy ją umownie "analizą danych") trend rozwijania się interfejsów graficznych w programach analitycznych. Zaczynają wyglądać naprawdę przyjemnie, pracuje się w nich płynnie, w zasadzie bez konieczności pisania kodu. Ostatnio wpadł mi w ręce Alteryx, jedna z nowszych platform #datacience #bigdata
Wrażenia pozytywne, graficznie jest wręcz pięknie i wygodnie. Jest integracja z R, ale brakuje Pythona. Do zautomatyzowania procesów czyszczenia, przetwarzania i raportowania danych wydaje się być interesującą propozycją - choć kosztowną :)

Z drugiej strony mamy darmowe oprogramowanie, które wymaga jednak większych umiejętności kodowania. Mocne analitycznie narzędzia jak #jezykr czy wszelkie dodatki do #python nie są może tak kolorowe i gładkie, ale skuteczne i (pozornie) darmowe.

Sądzę że wszystko jak zwykle będzie rozbijać się o budżet i ludzi. Wydać 5 000 $ na roczną licencję, czy zatrudnić/wyszkolić pracowników by działali na narzędziach #opensource ?

Zachęcam jeszcze do zajrzenia w komentarze - załączam tam podział softu z raportu Gartnera:
#spss od #ibm idzie łeb w łeb z #sas . Z kolei #sap (na wykopie chyba najaktywniejsza społeczność) przez Gartnera oceniony został jako nisza. Czekam na komentarze od mirko-ekspertów :)

Źródło - https://www.gartner.com/doc/reprints?id=1-3TK9NW2&ct=170215&st=sb

#programowanie #nieprogramowanie
#whatadata – analiza i wizualizacja danych, statystyka, ciekawostki z półświatka Data Science ( ͡° ͜ʖ ͡°)
w.....a - Od kilku lat obserwuję w branży (nazwijmy ją umownie "analizą danych") tren...

źródło: comment_qnPojIXSA6U29dfFmM2DR3Uz8S42YcWs.jpg

Pobierz
  • 20
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@whatadata: od jakiegoś czasu pracuję na Dataiku, graficzne konstruowanie flow'ów wraz z opcjonalnym użyciem R i Python oraz moduł maszynowego uczenia się robią robotę w większości problemów do analizy. Dodatkowym atutem jest możliwość importu pluginów z wewnętrznego 'sklepu' a jak czegoś brakuje to można napisać swój własny wewnątrz platformy. :) Ciekawe rozwiązanie, acz niestety też kosztowne.
  • Odpowiedz
ERP przyznaję że słyszę pierwszy raz.


@whatadata: ERP +otoczka, z definicji nie ma wsparcia (czy jak to nazwać) dla data science, bo po prostu nie do tego służy.
Jest biznes innteligence/hurtownie danych, ale to no właśnie nisza dla data science.

W ogóle SAP w kontekście data science jest nieporozumieniem :)
  • Odpowiedz
smutłem jak zobaczyłem pozycję #sap w tym kwadracie. Chłopaki mogliby bardziej HANĘ rozwijać, a nie robić connectory pokroju SAP HANA Vora.


@Qrystus: SAP to biznes a nie "science" wiec siłą rzeczy tam musi być, w ogóle dziwie się, że ktoś SAPa stawia w tym towarzystwie, np. taki rapid miner. to tak jak by porównywać excela vs worda,bo w wordzie też tabelkę można zrobić.

Dopóki, nie będzie komercyjnego super
  • Odpowiedz
@jaywalker: chodzi o samą wizualizację czy proces ETL? Tak do nauki podstaw z obu dobre jest Power Bi bo
1) To self-service BI czyli ma wbudowane własne narzędzie do ETL - czyli zaciągasz dane, przerabiasz je, transformujesz, oczyszczasz, ładujesz i tworzyć wizualizacje i analizy
2) możesz sobie ściągnąć na dysk i używać na prostych datasetach typu pliki .csv, excele
3) oczywiście może sobie skonfigurować jakąś bardziej skomplikowaną strukturę danych np. poprzez instalację MS SQL Server u siebie na kompie i dołączenie jakiejś tutorialowej bazy danych: Adventure Works, Contoso i wykorzystać je w Power Bi lub stworzyć kostkę OLAPową, z której będziesz mógł analizować nawet w Excelu
4) jest bezpłatne z większością funkcjonalności jeśli używasz desktopowo. Subskrypcja czyli Power Bi Pro służy głównie do udostępnienia raportów, dashboardów, przerobionych datasetów i analiz w portalu internetowych i sharowanie im innym użytkownikom w usłudze. Aczkolwiek ja na swoim prywatnym koncie daje przedłuż triala i pisze im "hej, jestem devem, wykorzystuje aplikację do nauki i wymyślaniu rozwiązań dla potencjalnych klientów" i drugi rok to spokojnie
  • Odpowiedz
@madry_i_mieciutki: Nie spodziewałem się takiej masy informacji! Ogromne dzięki! Czy warto dorzucić do tego jakąś teorię w postaci książek o analizie lub BI czy po prostu od razu podejść do zagadnienia praktycznie? Nie ukrywam, że temat jest arcyciekawy. Interesuję się szeroko pojętą optymalizacją (ale to takie ultra podstawy, praktycznie zero praktyki) a sądzę, że rozwój w tym kierunku oraz optymalizacyjnym byłby atrakcyjnym kąskiem na rynku pracy.
  • Odpowiedz
@jaywalker: zależy co już wiesz tak na prawdę. Chcesz wykorzystywać BI do analizowania sprzedaży? Dobrze, byś miał wiedzę ekonomiczną. Do finansów - znaj się na księgowości trochę, Do logistyki - itd. Business Intelligence to połączenie biznesu z analizą i wiedzą IT. Dlatego sama znajomość narzędzi nie wystarczy - trzeba się kształcić z tego jak działa biznes, dany system, sprzedaż etc. by wiedzieć jak to analizować. I oczywiście trzeba mieć umiejętności
  • Odpowiedz
@madry_i_mieciutki: zależałoby mi na logistyce i sprzedaży. Miałbyś coś godnego polecenia do poczytania? Przepraszam, że tak Cię męczę ale mam odczuwam ogromną potrzebę kształcenia się w tym kierunku. A jak widzę kogoś, co wie coś w temacie to tak jakbym złapał Pana Boga za nogi.
  • Odpowiedz
@jaywalker: jeśli chodzi o sprzedaż to ja się uczyłem po prostu tworząc wizualizacje sprzedażowe. Np ściągnąłem bazę danych Adventure Works (Microsoftowa tutorialowa baza). Ona tak ma transakcje sprzedaży w sklepach i z tego robiłem analizy w Power BI (tak serio to Power Bi jeszcze nie było więc robiłem w qlikview ale chodzi o to samo). No i jak chciałem się czegoś dowiedzieć typu jak się robi analizę ABC zapasów to
  • Odpowiedz