Wszystko
Wszystkie
Archiwum
4
WikiRank - ocena jakości i popularności Wikipedii
Serwis internetowy do automatycznej oceny jakości i popularności artykułów w różnych wersjach językowych Wikipedii.
z- Dodaj Komentarz
- #
- #
- #
- #
- #
- 0
Dataframy mi się sortują ładnie. Teraz pytanie - czy taki posortowany dataframe mogę zapisać jako posortowany parquet?
Bo zwykłe zapisane posortowanego df niestety nie daje oczekiwanego rezultatu i parquet (a potem external table z tego parqueta) nie są posortowane po tej kolumnie co dataframe.
Pewnie jest opcja, że się nie da, bo tabela to logiczne dane, a nie posortowany zestaw danych?
#pyspark #
Jeśli twój DF jest dość mały, możesz spróbować zapisania go jako jedna partycja (df.coalesce(1)), wtedy sortowanie powinno być zachowane, ale tracisz obliczenia na wielu klastrach.
- 1
Ale chcę to posortować i .orderBy(col("nazwakolumny").desc()) mi nie działa.
Jako ciekawostka - w jednym notebooku mi to ładnie działa, a w innym nie.
Nie wywala błędu, tylko po prostu nie sortuje.
Jakieś pomysły? Nie mam jakichś funkcji dociągniętych czy co?
#pyspark #synapse #bigdata #python
3
Naukowe źródła informacji w artykułach Wikipedii w różnych tematach i językach
Praca polskich naukowców została opublikowana w czasopiśmie "Procedia Computer Science" wydawnictwa Elsevier. W ramach pracy zostały przeanalizowane setki milionów przypisów artykułów Wikipedii z różnych wersji językowych w celu identyfikacji naukowych źródeł informacji.
z- 1
- #
- #
- #
- #
- #
- #
25
Wynajem mieszkań drożeje skokowo. Polska w światowej czołówce wzrostów czynszów
W ciągu ośmiu ostatnich lat czynsze w Polsce wzrosły tak bardzo, że znaleźliśmy się w ścisłe światowej czołówce pod tym względem. We wzroście kosztów wynajmu mieszkania wyprzedza nas tylko kilka krajów w zestawieniu 43 państw, dla których OECD zbiera dane.
z- 7
- #
- #
- #
- #
- #
- #
426
Algorytm Facebooka wykorzystuje wiedzę o ich lękach i słabościach użytkowników -
Facebook walczy o uwagę użytkowników, wykorzystując wiedzę o ich lękach i słabościach, a przyciski, które mają ograniczać wyświetlanie nie działają.
z- 67
- #
- #
- #
- #
- #
- #
2
Jak zacząć pozyskiwać właściwe dane z analityki cyfrowej
Rozpoczynanie rozumienia analityki cyfrowej może przypominać próbę czytania hieroglifów bez kamienia z Rosetty. Ale nie obawiaj się, drogi czytelniku! Przy odrobinie wskazówek i odrobinie dowcipu będziesz interpretować te tajemnicze liczby jak profesjonalista. Zatem zapnij pasy i zanurzmy s
z- Dodaj Komentarz
- #
- 0
https://https://angonpl.gumroad.com/
W stale zmieniającym się krajobrazie sztucznej inteligencji jedną z najbardziej rewolucyjnych technologii, jaka się pojawiła, jest GPT (Generative Pre-trained Transformer) OpenAI. GPT okazał się przełomowy w różnych dziedzinach, od przetwarzania języka naturalnego po generowanie kreatywnych treści. Aby w pełni wykorzystać potencjał GPT, zarówno entuzjaści, jak i profesjonaliści sięgają po kompleksowe zasoby, takie jak ściągawki i przewodniki. W
#pracait #businessintelligence #dataengineering #bigdata
- 0
- 0
- 128
⚪️ W czerwcu 2022 roku na YouTube co minutę dodawano ponad 500 godzin materiału wideo. To oznacza, że co godzinę pojawiało się około 30 000 godzin nowej treści. Na dodatek to CDNy, więc wszystkie treści i serwery są w kilku kopiach.
⚪️ Codziennie oglądamy ponad 1 miliard godzin filmów n
- godot_911
- konto usunięte
- qeti
- jebjebpahpah262
- ZaPolish
- +123 innych
- 39
YouTube brought in $7.7 billion in advertising revenue in its second quarter, reversing the prior trends of a downturn.
@Jakie: Nieprawda. Od dawna YT jest rentowny i przynosi dochody. Nie wiem dlaczego ludzie wygadują bzdury, które im się wydają jako fakty. Bezsens... Wszystko możesz sprawdzić w kilka sekund, ale lepiej pisać jako pewniak coś co sobie wymyślasz i jedynie wprowadzasz ludzi w błąd. Taki komentarz ma ujemną wartość informacyjną. Pewnie sobie
- Ze_Arcadio
- Caishen
- vries
- konto usunięte
- pietroo89
- +34 innych
- 18
- lomszyk
- vries
- konto usunięte
- niki_niki
- ZaPolish
- +13 innych
Coś w stylu, że tutaj damy trochę większy rabat, tutaj dla nas ciut większa prowizja, klient prawie nie zauważy, a dla nas to będzie znacząca różnica w profitowości takiego kontraktu.
1. Ile czasu realnie coś takiego mogłoby zająć? Cośtam
- 1
Jeśli chodzi o równanie do średniej to tutaj nie zda to egzaminu. Dlatego, że jeśli mamy parametr X (jakaś opłata_2 powiedzmy) dla klienta równa 100, a w modelu referencyjnym, tym najbardziej profitowym ten parametr dąży do 20, to równanie 100 do 20, czy nawet 50 nie ma sensu, bo klient na to nie pójdzie. Nie chcemy tutaj przerabiać każdej propozycji kontraktu pod jeden słuszny
#programownie #naukaprogramowania #it #python #bigdata
2
Podręcznik Inkrementalny: Skuteczne Zarządzanie Projektem
Zarządzanie projektami to kluczowy element sukcesu w dzisiejszym złożonym i dynamicznym środowisku biznesowym. Jednym z podejść, które znalazło szerokie zastosowanie w zarządzaniu projektami, jest podejście inkrementalne. W tym artykule przyjrzymy się, czym dokładnie jest podręcznik ink
z- 1
- #
2
Data Science: Kluczowa Dziedzina Współczesnej Informatyki
In today's increasingly data-driven world, data science plays a key role in acquiring knowledge, making decisions and developing new technologies. It is an interdisciplinary field that combines mathematics, computer science, statistics and business fields to extract value from data. In this article,
z- 1
- #
#programowanie #bigdata #datascience #programista15k
U mnie w robocie robili https://www.databricks.com/learn/training/catalog/apache-spark-programming ale to też raczej podstawowa wiedza. Gdybyś coś bardziej sensownego znalazł, to daj znać (kursy na udemy z tego tematu są kiepskiej jakości).
Trochę informacji na temat samego wykresu:
Chcielibyście więcej takich wykresów co miesiąc? :) Jakie macie inne pomysły na wykresy przedstawiające dane akcji #zbieramnatesle
#chatgpt #zbieramnatesle #januszeinwestowania #gielda #tesla #wykresy not quite #bigdata yet #chartporn
- Anekito
- Vadzior
- Plokij
- janusz-lece
- kamil-wasniewski
- +21 innych
- 5
- 1
- 1
#google #gmail #it #informatyka #internet #technologia #bigdata #cloud #chmura #komputery #chrome #youtube #pomocy
Pracuje od kilku lat w #testowanieoprogramowania jednak widzę że ilość ofert na stanowiska testerskie jest coraz mniejsza.
Myśle o zmianie zmianie na #bigdata #analizadanych #datascience #businessintelligence bo ilość ofert w tym obszarze jest kilka razy większa niż na #qa.
Doświadczenie mam głównie jako tester manualny, znam podstawy pythona i js (używane do testów automatycznych).
Jaki kierunek byłby dość naturalnym rozwojem z QA w kierunku pracy z danymi? Ogólnie