Wpis z mikrobloga

Dobra Panowie. W sumie to już nie szukam bo dokumentacja Pana Leo jest wystarczająca plus jest aktywny na Discordzie ZIO.

Wpisu nie usuwam bo może kogoś to zainteresuje.
@inny_89: o, ciekawa zajawka. zwykle piszę albo w jednym albo w drugim - ciężko by mi było przekonać team Sparkowy do ZIO. ma to ręce i nogi według ciebie?


@gabonczyk właśnie generalnie u mnie w firmie mocno zrazili się do scali kiedyś jak z projektami startowali i teraz wszystko na pysparku leci

Moim zdaniem to ma jak najbardziej sens. Lepsze wykorzystanie zasobów klastra i większa asynchronicznosc taskow sprawi, że podobne joby
@gabonczyk: tak jak w tym filmiku opowiada Leo i pokazuje execution plan. Czysto teoretycznie ZIO + Spark powinien działać szybciej niż czysty Spark ale tylko przy założeniu, że masz trochę bardziej skomplikowany job, w którym executory muszą czekać na wzajemne wykonanie i masz jakieś IO z postgresem czy innymi plikami bo dostep do nich jest "zrównobieżniany" (ni cholery nie wiem jak to ująć po Polsku co pewnie świadczy raczej o mojej
@gabonczyk: Jeszcze CIę tutaj zawołam bo muszę przyznać, że szybko się nie zabiore za ogarnięcie tego przykłądowego pipeline (a przynajmniej nie przez następne 2 tygodnie) ale zagadałem do tego Leo na oficjalnym doscordzie ZIO.

Poniżej jego odpowiedź odnośnie performencu na IO więc trochę może dać to pogląd dlaczego ZIO na SParku może mieć sens.
Aczkolwiek martwi mnie, ze on takich benchmarków wcześniej nie zrobił xD
Pobierz inny_89 - @gabonczyk: Jeszcze CIę tutaj zawołam bo muszę przyznać, że szybko się nie ...
źródło: comment_1636121185N4s0Pmud1Qz7b7i3UG7SnK.jpg