Wpis z mikrobloga

Skopiuj link

dzejro

18.06.2020, 17:50:03

Potrzebuję narzędzia do analizy olbrzymich sqlowcyh baz. Czego powinienem użyć?

#programowanie #scala (moze?)

t.....y

konto usunięte 18.06.2020, 18:44:20

@dzejro: sqla ( ͡° ͜ʖ ͡°)

enten

18.06.2020, 18:51:53

@dzejro: Ale co to za bazy? Masz zestaw wielu baz z których każda baza jest inna i ma inną strukturę czy szukasz technologii na razie i zastanawiasz się gdzie zapisywać olbrzymie ilosci danych żeby mieć w miarę szybkiego sqla?

Krever

18.06.2020, 18:59:06

Musisz mieć naprawdę ekstremalny przypadek żeby cokolwiek zewnętrznego było szybsze niż sama baza. Dbmsy są optymalizowane od dekad + mają dane lokalnie co daje ogromny boost.

Jeśli faktycznie masz taki case no to klaster + Spark i będzie szybko. Ale to nie jest coś co sam postawisz w rozsądnym czasie. Może są jakieś cloudowe rozwiązania które to ulatwiaja (databricks?) ale nie śledzę tematu więc nie pomogę.

inny_89

18.06.2020, 19:04:14 via Android

@dzejro databricks tak jak sugerował @Krever postawisz sam szybko i dosyć bezboleśnie.
Jednak jakbyś podał więcej szczegółów do chcesz zrobić to łatwiej będzie doradzić.

dzejro

18.06.2020, 19:19:52

@inny_89: @Krever: @enten: mam kilkanaście/kilkadziesiąt olbrzymich baz danych różnego typu (i.e. postgree, snowflake) i chciałabym je analizować w taki sposób ze wybieram sobie baze i na niej wykonuje jakies zapytanie - typu pobierz mi liste filmów z danymi ile zarobiły i posortuj po roku. Każda baza jest inna więc nie mogę napisać kodu pod baze i konkretne tabele

enten

18.06.2020, 19:30:42

Może tego spróbuj: https://www.jetbrains.com/datagrip/

inny_89

18.06.2020, 19:40:20 via Android

@dzejro to databricks. Tam masz connectory do wszystkiego a między bazami możesz przeskakiwać zmieniając jedna nazwę

Krever

18.06.2020, 19:40:28

@dzejro: Faktycznie brzmi ok. Jeśli możesz to ja bym spróbował z każdej bazy zrobic etl na hdfsa + normalizacja i tam czesał sparkiem już z jednego źródła. Jeśli się nie da (bo szkoda storagu albo za dużo roboty) no to też Spark i bezpośrednio do każdej bazy ale wtedy będziesz za każdym razem płacił (w czasie wykonania) za transfer na klaster.
Przy czym najpierw sprawdź czy Spark ma connectory do wszystkich

Aktywne Wpisy

ZenujacaDoomerka

ZenujacaDoomerka +54

2 godz. i 5 min temu

Czemu ludzie uważają, że mając 30 lat powinno ich wszystko boleć, nie mieć siły i w ogóle, że są starzy? Przecież większość ludzi mając 30 lat dopiero życie zaczyna można powiedzieć bo są po studiach i zazwyczaj w tym wieku dopiero ma się jakieś normalne życie zawodowe.

Nie znałam żadnej osoby po 30 która by się jakoś różniła mocno od 25 latka. Może po prostu tych narzekających tak to narzekanie postarza

#

Szarmancki-Los

Szarmancki-Los +17

3 godz. i 1 min temu

Też uważacie że hiszpański brzmi zajebiscie? Jak spotkam gdzieś jakąś Latynoskę i tą zacznie nawijać po hiszpańsku to mi od razu miękną nogi i aż czuję jak mój rozwijany latami sigma grindset opuszcza moje ciało. Taka typiara mogła by sobie owinąć mnie wokół palca a ja bym się pewnie zachowywał jak simp bez godności.

Aktywne Wpisy

Aktywne Znaleziska

Hetman o Thun: Uwiarygodniła wszystko to, co w kampanii mówiła Konfederacja

Eksperymentalna terapia Pfizera poniosła klęskę. Śmierć małego chłopca

Zwiększa się ilość ukraińskich transportów zboża koleją do Polski i Rumunii

Jest śledztwo w sprawie przekroczenia uprawnień przez Mateusza Morawieckiego

W Niemczech taniej niż na Narodowym... Ile kibic zapłaci za napoje i przekąski?

Popularne tagi