jaki polecacie najlepszy tutorial online (tak żeby sobie puszczać na kompie, patrzeć co wyszło i poprawiać) #pyspark , głownie bym chciał te moduły z dataframe/sql a potem ML
#python #programowanie
#python #programowanie
Wszystko
Najnowsze
Archiwum
Apache Ambari
spark.conf.set("spark.sql.sources.partitionOverwriteMode","dynamic")Wybacz też wysoki poziom abstrakcji przy opisywaniu
źródło: comment_dGkLfVOMSPprFoHJyvYWC3BbdyPXJUyo.jpg
Pobierz
źródło: comment_pnzX9R6vsbBcUQRQoemU8o6AmDb9Fbef.jpg
Pobierz
źródło: comment_nwWDp2whKktxSgB0jHNoeWqqTn5Pua0N.jpg
PobierzRegulamin
Reklama
Kontakt
O nas
FAQ
Osiągnięcia
Ranking
Czy ktos mi podpowie czemu scala zostala zepchnieta (przynajmniej z tego co czytam i widze w necie) na drugi plan jako jezyk sparka? Przeciez to jego natywny jezyk?
Tu pytanie do osob siedzacych w Azure i robiacych na nim DE:
Czego sie teraz najwiecej uzywa? PySparka? SparkSQL? Jesli tak to dlaczego? W czym piszecie notebooki?
źródło: image
Pobierz-python jest bardziej przyjaznym i uniwersalnym językiem od scali, dominującym w ekosystemie AI i data. Ogromna liczba bibliotek pod każdy typowy problem w DE i data analytics sprawia, że deweloperzy wolą pracować z pythonem.
-dla większości zastosowań w data engineeringu i analityce używanie scali nie ma żadnej wartości dodanej albo ma minimalną
-dużo łatwiej wdrożyć kogoś do pysparka. Absolwenci kierunków IT mają np podstawy pythona i pandas