Wpis z mikrobloga

Skopiuj link

05.10.2021, 20:42:08

Mirki, mam pytanie początkującego, z którym w jakiś niepojęty dla mnie sposób nie jestem w stanie sobie poradzić.

Czy Spark albo Kafka same w sobie magazynują przetwarzane dane i w każdym momencie mogę się do nich odwołać? Załóżmy, że za pomocą Sparka łączę się z bazą i wykonuję transformacje do analityki. Czy na końcu pipeline zawsze musze załadować te dane to hurtowni bo po zamknięciu joba one przepadną? Jak nazywa się ten feature sparka?

#bigdata

Krever

06.10.2021, 05:29:13

@Meriu:

Czy Spark albo Kafka same w sobie magazynują przetwarzane dane

Nie

Czy na końcu pipeline zawsze musze załadować te dane to hurtowni bo po zamknięciu joba one przepadną?

Tak

Chętnie bym coś wiecej pomógł ale tu nie ma nic więcej do dodania. Jest dokładnie tak jak sam napisałeś. Spark stara sie wykonywać wszystko w RAMie i fallbackuje do dysku tylko jak musi i nawet wtedy te dane są ulotne.

y.....l

konto usunięte 06.10.2021, 05:30:00

@Meriu: Spark to nie jest baza danych. Jak przetworzyły dane to musisz je gdzieś zapisać. Kafka to tez nie jest baza danych.

plusujemny

06.10.2021, 06:27:39 via Wykop Mobilny (Android)

@Meriu: w Sparku tak naprawdę schedulujesz sekwencję transformacji która się nie wywoła dopóki nie striggerujesz akcji - zwykle tą akcją jest zapis danych do plików albo np. wypisanie dataframea w konsoli.
Jak nie wywołasz akcji to nic nie przepada bo nie ma co (nic się nie przetwarza).
Jeśli wywołasz akcję to w sumie też nic nie przepada bo akcją jest najczęściej zapis ( ͡° ͜ʖ ͡°) chyba

Meriu

06.10.2021, 12:48:12

@Krever: @yggdrasil: @plusujemny: Dzięki za odpowiedzi. Czyli po zaczytaniu i przetworzeniu danych musze je jeszcze przesłać dalej, np do hurtowni albo tak jak pisaliście bazy danych. Gdzie zatem w przypadku wykorzystania Sparka albo Kafki pozycjonuje się ustawienie Hadoopa? Jako źródło danych, czy jako cel, czy jako oba (pobierz, przetwórz, zapisz jako np. zbiór analityczny)?

@plusujemny: Mam jeszcze pytanie pomocnicze, czy bobrze wnioskuję, że do triggerowania operacji wykonywanych za

y.....l

konto usunięte 06.10.2021, 13:43:13

Jako źródło danych, czy jako cel, czy jako oba

@Meriu: Możesz korzystać w oba sposoby.

Ja w jednym projekcie miałem tak:

rabbitMQ -> hadoop -> spark -> kafka -> spark -> hadoop -> spark -> hadoop

plusujemny

07.10.2021, 17:42:46 via Wykop Mobilny (Android)

@Meriu: airflowem możesz triggerować cokolwiek, tak samo do triggerowania możesz używać jakiegokolwiek schedulera (np. crona na linuxie).

Aktywne Wpisy

lunari6

lunari6 +73

4 godz. i 19 min temu

Hej Mirki i Mirabelki,
Od dłuższego czasu przeglądam mirko. Jakiś czas temu miałam okazję pomóc jednemu mirkowi z zaburzeniami lękowymi. Za jego namową założyłam konto. Mam na imię Dominika i jestem absolwentką #psychologia na Uniwersytecie Jagiellońskim. Oferuję szeroko pojętą pomoc psychologiczną w formie online. Pracuję z osobami dorosłymi oraz młodzieżą. Pomagam osobom z zaburzeniami: emocjonalnymi, osobowości, nastroju, odżywiania, osobom o obniżonym poczuciu własnej wartości. Zapraszam serdecznie do kontaktu na priv jeśli jesteście

daeun

daeun +62

5 godz. i 29 min temu

Ja #!$%@?, jest tyle ciekawych rzeczy wartych zrobienia i zobaczenia przed śmiercią, można na przyklad kupić motocykl i wyruszyc w trip dookoła swiata, można zdać kurs paralotniowy lub polatać na wingsuicie, albo pojechać do Tajlandi i wyruchać lejdiboya. Mnóstwo alternatyw na wydanie ciężko zarobionych pieniędzy.

Polakowi jednak nie w głowie głupoty. Polaczek ma tylko jeden cel dla którego żyje i umiera - lać setki metrów przestrzennych betonu na randomowej łące pod lasem

daeun - Ja #!$%@?, jest tyle ciekawych rzeczy wartych zrobienia i zobaczenia przed śm... — **źródło:** temp_file1078226948057566305
Pobierz

Aktywne Wpisy

Aktywne Znaleziska

Stary kocioł energetyczny (konwencjonalny) od wewnątrz

Ludzie Zbigniewa Ziobry dostawali ogromne pieniądze. Mieli sprytne sposoby

Wyborcza odkrywa, że rozbudowa lotniska w mieście, zamraża budowy w mieście

30 lat od największej katastrofy na polskich drogach [REPORTAŻ]

Morawiecki na okładce prorosyjskiego węgierskiego tygodnika. Tusk króciutko.

Popularne tagi