Wpis z mikrobloga

Chciałbym zamiast BI/ETL developerem, zostać Data Engineerem. Czego powinienem się uczyć?

Co umiem:
-SQL, T-SQL
-ETL toole (Azure Data Factory, SSIS i inne)
-Raportowanie: Power BI, Excel, Tableau, Reporting Services
-trochę PowerShell
-projektowanie i modelowanie hurtowni danych
-biznesowo rozumiem m.in. finansówkę, inventory, sprzedaż, zakupy (umiem zrobić PnL, wiekowanie zapasów, multi currency etc.)
-specyfika różnych systemów ERP
-podstawy pythona

Czego powinienem się uczyć?
-?
-?
-?

Czego się uczę obecnie
-Python: pandas
-Airflow
-Databricks i PySpark

Jakie wrażenia obecnie?
Czuje trochę sporą learning curve związaną z nauką samego programowania. Z drugiej strony okazuje się, że moje umiejętności z Business Intelligence nie są aż przydatne, a głównie czuję nacisk na ogarnianie jakichś linuxów, dockerów (Airflow) i samo kodowanie. Czyli wychodzi na to, że najpierw muszę zostać programistą, a potem mogę być Data Engineerem?

#dataengineering #programista15k
  • 9
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@przecietnyczlowiek: Moim zdaniem Linux - tj. ogólna znalomość systemów unixowych tak, aby dostać dostęp przez SSH do czegoś, i nie panikować kiedy trzeba wykonać kilka komend, coś przepajpować i następnie posłać wyniki do SQLowej (lub nie) bazy danych.

Aktualnie sam szukam kogoś kto nadaje się do tematów bazodanowych. Coś pomiędzy Data Engineer a Business Analyst. W każdym razie, stack większości zintegrowanych u mnie systemów jest mocno linuksowy, i taki pozostanie.
  • Odpowiedz
@przecietnyczlowiek: Jeszcze w temacie, przypomniał mi się (już trochę stary) dowcip w dziedzinie przetwarzania danych na Linuksie.

Kierownik do sekretarki:
Pani Zosiu, czy może Pani przegrać naszym partnerom wyniki za kwiecień, oni zaraz podejdą.
- Dzień dobry, czy to Panom mam przegrać wyniki miesięczne?
- Dzień dobry, tak, nam, gdyby była Pani uprzejma, tu mamy
  • Odpowiedz