Wpis z mikrobloga

fascynuje mnie masturbowanie się do terminu #bigdata przy czym zazwyczaj jest on rozumiany jako wrzucenie wszystkich danych do jakiegoś narzędzia "i już" (w stylu: wepchnięcie wszystkiego do #hadoop czy jakichś rakotwórczych rozwiązań w stylu #mongodb). Oczywiście ważna jest możliwość przechowywania gdzieś zbiorów danych, ale w tych wszystkich no-SQLowych cudach ciężko robić zapytania, czy transakcje. Szczerze mówiąc nigdy nie zrozumiałem ludzi, którzy nie wdażają od razu RDBMSa, już nie wspominając o konsultantach, którzy ostatnio majaczą o amerykańskim pomyśle "data lake" - czyli "macie z-----e dane? wepchniemy je do jakiejś bazy danych i będziemy martwić się później" - pomysł tak rakotwórczy, że zamiast konsultantów lepiej od razu zatrudnić onkologów.

W sumie wdrożenie czegoś takiego też można uznać za sukces, ale c'mon postawienie hadoopa, to trochę jak postawienie windowsa, dopiero początek, a nie koniec pracy. Jednak prawdziwe analizy czy data mining można robić tylko na dobrych DB, a nie jakimś JSONowym gównie.

Już nie mówię, o narzędziach które same by potrafiły zaproponować jakieś głebsze zapytanie niż SELECT - ale jest tylko jedna odpowiedź: "człowieku, naucz się R", czy tam "zatrudnijcie statystyka" xD

Nawet zrobienie jakiegoś zrzutu żeby próbować się z nim j---ć w gephi to często problem

  • 7
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

SAP HANA.


@Qrystus: SAP HANA to też jest trochę mowa tylko o silniku, zamiast całym rozwiązaniu - to chyba chodzi na jakiejś kolumnowej bazie danych i jest piekielnie szybkie, ale nie zmienia to głównego problemu SAPa - tych tysięcy tabel z kryptycznymi nazwami.
Swoją drogą jak mówimy o samym SAPie - to jako jedno z niewielu rozwiązań generalnie wszystko w nim działa i da nawet trochę customizować (chociaż zazwyczaj to
  • Odpowiedz
@fledgeling: Oczywiście, że nie. SAP HANA opiera się na bardzo dużej ilości RAM -> dla ERP najlepiej zaczynać od 256GB i też nie nadaje się do Big DAta.

A co jest w tych 86000 tabel to można w se16n sprawdzić. Tylko kto by chciał. :)
  • Odpowiedz
@Qrystus: Moim zdaniem SAP HANA to kolejny pusty termin. Jako backend który pozwala pozbyć się tych zasranych kostek - to bardzo dobry pomysł. Ale nadal nie dotyka to opisanego przeze mnie tam wyżej problemu związanego z raportowaniem.

Ze 2 lata temu byłem na jakiejś prezentacji SAP HANA w SAP Polska i mówili, że wdrożyli to w TESCO (czy innym markecie) do trzymania danych z paragonów, więc danych chyba ta ich
  • Odpowiedz