#bigdata - strona 2

Wszystko

Najnowsze

Archiwum

15.04.2024, 10:44:46

✨️ Obserwuj #mirkoanonim
Mirki, wybieram się w tym roku na studia podyplomowe big data. Zastanawiam się nad Politechniką Warszawską i SGH. Macie jakieś opinie na temat tych studiów? Które byście wybrali? Który program wydaje wam się lepszy?
1. https://www.sgh.waw.pl/studia-podyplomowe-i-mba/transformacja-cyfrowa/studia-podyplomowe-inzynieria-danych-big-data
2. https://ds.ii.pw.edu.pl/bigdata.html

#bigdata #korposwiat #programista15k #programowanie

AAAAAPsik

15.04.2024, 10:51:16 via Wykop

@mirko_anonim:

programista15cm

15.04.2024, 10:55:52 via Wykop

@mirko_anonim: przejrzałem program tych "studiów" to większość szkoleń do certyfikatów seniorskich ma ZNACZENIE ambitniejszy zakres

mirko_anonim

21.02.2024, 11:49:04

✨️ Obserwuj #mirkoanonim
Pracuje od kilku lat w #testowanieoprogramowania jednak widzę że ilość ofert na stanowiska testerskie jest coraz mniejsza.
Myśle o zmianie zmianie na #bigdata #analizadanych #datascience #businessintelligence bo ilość ofert w tym obszarze jest kilka razy większa niż na #qa.
Doświadczenie mam głównie jako tester manualny, znam podstawy pythona i js (używane do testów automatycznych).
Jaki

Zapaczony

09.02.2024, 11:28:29

#internet #socialmedia #google #amazon #facebook #ciekawostki #bigdata

WikiRank - ocena jakości i popularności Wikipedii

Serwis internetowy do automatycznej oceny jakości i popularności artykułów w różnych wersjach językowych Wikipedii.

z dodany: 16.01.2024, 08:46:49

LucaJune

29.12.2023, 16:23:32

Mam pytanie uzupełniające do mojego wczorajszego pytania o sortowanie.
Dataframy mi się sortują ładnie. Teraz pytanie - czy taki posortowany dataframe mogę zapisać jako posortowany parquet?
Bo zwykłe zapisane posortowanego df niestety nie daje oczekiwanego rezultatu i parquet (a potem external table z tego parqueta) nie są posortowane po tej kolumnie co dataframe.

Pewnie jest opcja, że się nie da, bo tabela to logiczne dane, a nie posortowany zestaw danych?

ch1nczyk

29.12.2023, 16:32:35 via Android

@LucaJune Z tego co wiem to nie da się osiągnąć sortowania w parquet, ze względu na sposób w jaki zapisuje on dane (kolumny). Z reguly sortowanie musi odbyć się jeszcze raz po wczytaniu.

Jeśli twój DF jest dość mały, możesz spróbować zapisania go jako jedna partycja (df.coalesce(1)), wtedy sortowanie powinno być zachowane, ale tracisz obliczenia na wielu klastrach.

programistalvlhard

30.12.2023, 14:15:24 via Wykop

@LucaJune: @ch1nczyk Dokładnie, zapisując na plikach nie masz opcji zapisania "posortowanego", co najwyżej możesz używać takich metod jak clustering eg https://docs.databricks.com/en/delta/clustering.html czy partycjoniwanie.

LucaJune

28.12.2023, 16:24:49

Mam w Synapsie Analytics dataframe złożony z joinów z 10 innych dataframów, nic przesadnie skomplikowanego.
Ale chcę to posortować i .orderBy(col("nazwakolumny").desc()) mi nie działa.

Jako ciekawostka - w jednym notebooku mi to ładnie działa, a w innym nie.

Nie wywala błędu, tylko po prostu nie sortuje.

wezuza123

28.12.2023, 18:04:01 via iOS

@LucaJune lepiej zaciągać wszystkie czymś pokroju import pyspark.sql.functions as F, bo możesz mieć kolizję z funkcjami pythonowymi o tej samej nazwie np. sum, min itp.

wezuza123

28.12.2023, 18:22:29 via iOS

@LucaJune tak.

Naukowe źródła informacji w artykułach Wikipedii w różnych tematach i językach

Praca polskich naukowców została opublikowana w czasopiśmie "Procedia Computer Science" wydawnictwa Elsevier. W ramach pracy zostały przeanalizowane setki milionów przypisów artykułów Wikipedii z różnych wersji językowych w celu identyfikacji naukowych źródeł informacji.

z dodany: 28.12.2023, 13:02:36

Wynajem mieszkań drożeje skokowo. Polska w światowej czołówce wzrostów czynszów

W ciągu ośmiu ostatnich lat czynsze w Polsce wzrosły tak bardzo, że znaleźliśmy się w ścisłe światowej czołówce pod tym względem. We wzroście kosztów wynajmu mieszkania wyprzedza nas tylko kilka krajów w zestawieniu 43 państw, dla których OECD zbiera dane.

z dodany: 19.12.2023, 06:58:36

Algorytm Facebooka wykorzystuje wiedzę o ich lękach i słabościach użytkowników -

Facebook walczy o uwagę użytkowników, wykorzystując wiedzę o ich lękach i słabościach, a przyciski, które mają ograniczać wyświetlanie nie działają.

z dodany: 08.12.2023, 10:02:07

Jak zacząć pozyskiwać właściwe dane z analityki cyfrowej

Rozpoczynanie rozumienia analityki cyfrowej może przypominać próbę czytania hieroglifów bez kamienia z Rosetty. Ale nie obawiaj się, drogi czytelniku! Przy odrobinie wskazówek i odrobinie dowcipu będziesz interpretować te tajemnicze liczby jak profesjonalista. Zatem zapnij pasy i zanurzmy s

z dodany: 06.12.2023, 05:23:04

0
#
bigdata

chatman

15.11.2023, 23:47:35

????Odblokowanie mocy GPT: Ściągawka główna + 5jailbreak???? i Ściągawka CodeInterpreter GPT [Lite] ????
https://https://angonpl.gumroad.com/

W stale zmieniającym się krajobrazie sztucznej inteligencji jedną z najbardziej rewolucyjnych technologii, jaka się pojawiła, jest GPT (Generative Pre-trained Transformer) OpenAI. GPT okazał się przełomowy w różnych dziedzinach, od przetwarzania języka naturalnego po generowanie kreatywnych treści. Aby w pełni wykorzystać potencjał GPT, zarówno entuzjaści, jak i profesjonaliści sięgają po kompleksowe zasoby, takie jak ściągawki i przewodniki. W tym

chatman - ????Odblokowanie mocy GPT: Ściągawka główna + 5jailbreak???? i Ściągawka C... — **źródło:** hackerser2
Pobierz

pa6lo

16.11.2023, 11:57:37 via Wykop

@chatman: Wypad z tym podejrzanym spamem.

peoplearestrange

28.10.2023, 09:37:08

A dobra, co mi tam, skoro chłopaki dzisiaj taką nagonkę prowadzą to też dorzuce od siebie trzy grosze ( ͡° ͜ʖ ͡°)
#pracait #businessintelligence #dataengineering #bigdata

peoplearestrange - A dobra, co mi tam, skoro chłopaki dzisiaj taką nagonkę prowadzą t... — **źródło:** inzynier danych
Pobierz

przecietnyczlowiek

28.10.2023, 12:01:14 via Wykop

@peoplearestrange: no wg mnie juniorom trudniej znaleźć teraz pracę

piwomojepaliwo

29.10.2023, 20:31:42 via Wykop

@peoplearestrange: też widziałem ten post, szkoda że reakcji nie wrzuciłeś. Kierunek i zwrot był jasny :-)

benxz

30.09.2023, 12:57:53

Hej, czy ktoś z was studiował albo zna osoby, które studiowały na studiach magisterskich po angielsku na SGH? Czy jest tam ciężej, lżej niż na polskich i na jakim poziomie jest angielski i zajęcia? #sgh #bigdata #studia #magisterka

benxz

30.09.2023, 13:17:46 via Wykop

@malebro: nie wątpię xd tylko ogólnie pytam czy różnią się poziomami

piteros_94

01.10.2023, 10:02:38 via Android

@benxz kilka przedmiotów brałem po angielsku, matematyczne - bez różnicy w poziomie, jak wiążesz przyszlosc z ekonometrią to polecam by liznąć jezyka specjalistycznego, jak nie to odradzam bo to dodatkowa przeszkoda w uczeniu się; reszta wg mnie trochę łatwiejsze, tj więcej zaliczania projektami czy prezentacjami. Ale to było w 2016, więc nie wiem, czy info aktualne

janjanuszziom

22.09.2023, 02:08:45

Statystyki YouTube są zadziwiające. Ciężko uwierzyć że działa tak sprawnie i są w stanie skalować tak ogromny ruch i objętość treści.

⚪️ W czerwcu 2022 roku na YouTube co minutę dodawano ponad 500 godzin materiału wideo. To oznacza, że co godzinę pojawiało się około 30 000 godzin nowej treści. Na dodatek to CDNy, więc wszystkie treści i serwery są w kilku kopiach.

⚪️ Codziennie oglądamy ponad 1 miliard godzin filmów na YouTube.

janjanuszziom

22.09.2023, 02:30:57 via Wykop

YouTube brought in $7.7 billion in advertising revenue in its second quarter, reversing the prior trends of a downturn.

@Jakie: Nieprawda. Od dawna YT jest rentowny i przynosi dochody. Nie wiem dlaczego ludzie wygadują bzdury, które im się wydają jako fakty. Bezsens... Wszystko możesz sprawdzić w kilka sekund, ale lepiej pisać jako pewniak coś co sobie wymyślasz i jedynie wprowadzasz ludzi w błąd. Taki komentarz ma ujemną wartość informacyjną. Pewnie

janjanuszziom

22.09.2023, 02:47:08 via Wykop

Porównywanie YouTube do np. Netflixa jest bardzo głupie. Może Netflix ma dużą oglądalność, ale tutaj istotne jest jedynie obsłużenie dużego uploadu. Samych treści na Netflixie jest strasznie malutko względem YouTube. Tyle co nic. Muszą obsłużyć jedynie duży ruch ale danych do przechowywania mają nieporównywalnie mniej.

MarteenVaanThomm

15.09.2023, 17:37:27

Robię model profitowości kontraktów handlowych w #pracbaza i chciałbym podpiąć pod niego prosty model machine learning, który na podstawie wstępnej propozycji handlowca proponowałby zoptymalizowane parametry takiego kontraktu, tak aby dążyć do maksymalnej profitowości.

Coś w stylu, że tutaj damy trochę większy rabat, tutaj dla nas ciut większa prowizja, klient prawie nie zauważy, a dla nas to będzie znacząca różnica w profitowości takiego kontraktu.

1. Ile czasu realnie coś takiego mogłoby zająć?

MarteenVaanThomm - Robię model profitowości kontraktów handlowych w #pracbaza i chcia... — **źródło:** image
Pobierz

Bejro

15.09.2023, 22:40:45 via Wykop

@MarteenVaanThomm: jak masz dużo danych i ich model nie jest raczej skomplikowany to sieci neuronowe mogą łatwo być overkillem - model użyj jaki chcesz, ale nie przesadzaj z jego wielkością. Nie wiem też co dokładnie chcesz osiągnąć i dlaczego nie można tego po prostu policzyć. Jeśli masz zbiór zatwierdzonych "optymalnych" kontraktów i chcesz włożyć nowy nieoptymalny kontrakt aby go poprawić to możesz tu zastosować maszynę Boltzmanna. Ewentualnie zastosować redukcję wymiarowości,

MarteenVaanThomm

16.09.2023, 09:35:27 via Wykop

@Bejro: dzięki bardzo, sporo ciekawych rzeczy piszesz.

Jeśli chodzi o równanie do średniej to tutaj nie zda to egzaminu. Dlatego, że jeśli mamy parametr X (jakaś opłata_2 powiedzmy) dla klienta równa 100, a w modelu referencyjnym, tym najbardziej profitowym ten parametr dąży do 20, to równanie 100 do 20, czy nawet 50 nie ma sensu, bo klient na to nie pójdzie. Nie chcemy tutaj przerabiać każdej propozycji kontraktu pod jeden

jestemmimas

10.09.2023, 16:19:49

Cześć Mirki, polecicie jakiś kurs po angielsku do Pythona i Big Data? Uczyłem się mocno Node.js, ale chciałbym pobawić się Pythonem. Najfajniej jakiś kombajn z dużo liczbą godzin i dużą ilością materiału ( ͡° ͜ʖ ͡°)
#programownie #naukaprogramowania #it #python #bigdata

Kotek00010

10.09.2023, 17:37:59 via Wykop

@jestemmimas: 1.https://www.w3schools.com/python/default.asp 2.https://www.javatpoint.com/python-tutorial 3.https://www.geeksforgeeks.org/python-programming-language/ 4.https://www.youtube.com/watch?v=XKHEtdqhLK8

arysto2011

10.09.2023, 18:40:26 via Wykop

PySpark

Podręcznik Inkrementalny: Skuteczne Zarządzanie Projektem

Zarządzanie projektami to kluczowy element sukcesu w dzisiejszym złożonym i dynamicznym środowisku biznesowym. Jednym z podejść, które znalazło szerokie zastosowanie w zarządzaniu projektami, jest podejście inkrementalne. W tym artykule przyjrzymy się, czym dokładnie jest podręcznik ink

z dodany: 04.09.2023, 12:09:05

1
#
bigdata

Data Science: Kluczowa Dziedzina Współczesnej Informatyki

In today's increasingly data-driven world, data science plays a key role in acquiring knowledge, making decisions and developing new technologies. It is an interdisciplinary field that combines mathematics, computer science, statistics and business fields to extract value from data. In this article,

z dodany: 04.09.2023, 12:09:04

1
#
bigdata

piotrlionel

25.08.2023, 20:23:52

Mirabelki/Mirki polecają jakiś bardziej złożony kurs Pysparka /apache sparka z pythonem. Środowisko to databricksy osadzone na Azure. Niby człowiek pisze ale z googlem i bym przejrzał fajne materiały żeby uporządkować wiedzę i ciut lepiej pisać kod ;). Niby działa ale wstyd PRy wystawiać.
#programowanie #bigdata #datascience #programista15k

rusin

25.08.2023, 22:05:01 via Wykop

Z bardziej złożonymi jest problem - jest zatrzęsienie kursów "Hello World"-owych, ale to wiedza, którą pewnie już masz.
U mnie w robocie robili https://www.databricks.com/learn/training/catalog/apache-spark-programming ale to też raczej podstawowa wiedza. Gdybyś coś bardziej sensownego znalazł, to daj znać (kursy na udemy z tego tematu są kiepskiej jakości).

anonimowy_programista

23.07.2023, 14:38:19

Wrzuciłem swojego Google Docsa #zbieramnatesle do ChataGPT4/Code Interpreter i poprosiłem go, by wygenerował dla mnie wykres "Skumulowane wpłaty (na zakup akcji Tesli) i wypłaty, oraz średnia cena akcji na przestrzeni czasu".

Trochę informacji na temat samego wykresu:

anonimowy_programista

23.07.2023, 14:39:27 via Wykop

@anonimowy_programista: wykres może zawierać błędy. Nie analizowałem jeszcze dokłądnie poprawności kodu, jakim wykres został wygenerowany...ale generalnie wykres wygląda mniej więcej na prawidłowy.

anonimowy_programista

05.02.2024, 16:52:28 via Wykop

@zalozyc_bukmacherke_w_afryce: na razie nic się nie stało. Starlink może w przyszłości będzie publiczny, ale jeszcze nie jest.