Wpis z mikrobloga

Skopiuj link

07.04.2023, 11:57:24

Jakie jest best practice jeśli chodzi o tworzeniu notebooków w Azure Synapse Analytics, lepiej wiele małych, czy jeden duży?
Poznaję to dopiero i rozkminiam. Obecnie mam zastany jeden ogromny notebook i kilka średnich i myślę czy tego nie porozdzielać na kilkanaście małych i potem to ładować do pipelinów.

#azure #azuredatafactory #synapseanalytics #azuresynapse #powerbi

przecietnyczlowiek

07.04.2023, 12:21:50 via Wykop

@LucaJune: tak naprawdę zależy co tam robisz tym notebooku. Ale generalnie chodzi o to, żeby to było w miarę logicznie podzielone. Żeby jasno było widać twój ETL/ELT flow i np. jeden notebook odpowiadał jednemu outputowi docelowemu (np. przetworzonej tabeli) Np. jeżeli masz jeden notebook w którym ładujesz 5 tabelek (wymiarów np.) po kolei no to trochę to jest źle. Lepiej zrobić to odzielnie bo np. wtedy w pipelinach jesteś w stanie

LucaJune

07.04.2023, 17:44:06 via Wykop

@przecietnyczlowiek: dzięki za kompleksową odpowiedź ????
Doceniam, że Ci się chciało. Czyli muszę to porozdzielać. Bo teraz mam tak, że jest jeden giga notebook gdzie tworzone jest kilka tabel.
Jakieś zmiany w nim i debugowanie to katorga.

Jego wykonywanie trwa z godzinę, najdłużej zapisywanie do datalake. To normalne czasy? 4 core tylko dostępne niestety

przecietnyczlowiek

08.04.2023, 18:56:25 via Wykop

@LucaJune: nie wiem jaki wolumen danych, nie wiem czy to spark notebook czy sql notebook. No jeśli zapisywanie do adls2 trwa długo to musisz sprawdzić jaki masz storage ustawiony, może cold tier? I czy ten sam region przede wszystkim co synapse. No i czy dane są popartycjonowanie jakoś sprytnie i w jakim formacie. Jeden duży .csv to zły pomysł. Powinno być wiele parquetów. Ale zbyt wiele małych plików to również zły

Aktywne Wpisy

Wezzore-04

Wezzore-04 +416

5 godz. i 38 min temu

6 lat, nowe generacje konsol, a nie ma gry, która by przebiła wyglądem RDR2. Niesamowicie się do tego wraca. Najgorzej, że chłop nie może zapomnieć zakończenia i nie jest to samo co za pierwszym razem #rdr2 #gry