Cześć, zaczynam się uczyć #R i próbuję zrobić wordcloud używając biblioteki wordcloud2. Zauważyłem, że ich przykładowy dataframe jest inny niż mój i zastanawiam się jak powinienem przeprocesować własne dane, żeby wyglądały podobnie pod względem struktury i typu.

#jezykr #programowanie #kiciochpyta
Demo:
kamilm119 - Cześć, zaczynam się uczyć #R i próbuję zrobić wordcloud używając bibliote...

źródło: R1

Pobierz
  • 4
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 0
@heniek_8: Hej! Pewnie, że tak być powinno! W badaniu pracowałem nad dwoma wordcloudami, które pokazywały rosyjskie reakcje na newsy. Po rosyjsku 'fake' bylo opisywane różnymi slowami, ale angielskie tłumaczenie wszystko sprowadziło fo 'fake' właśnie. Nie mam problemu z tym, zeby to naprawić - pytam o coś zupełnie innego.

Jak widac po moich danych to one wygladają mniej więcej tak

[1] słowo1 numer1
[2]
  • Odpowiedz
masz tam row.names, od których obecnie się odchodzi (np tibble i data.table tego nie wspierają)

library(dplyr)
demoFreq = data.frame ( word = c('oil','said','prices'), freq=c(85, 73, 48))
row.names(demoFreq) = demoFreq$word

head(demoFreq)
  • Odpowiedz
Zainteresowanych #mirkopromocje zainteresować może fakt, ze w najbliższych dniach księgarnia Helion obchodzić będzie okrągłe 32 urodziny. Świętowanie zaczyna od rozdawnictwa - w zamian za zapisanie się na newslettera księgarni, możemy otrzymać e-booka bądź jeden z 2 kursów video:

- Witold Wrotek Elektronika. Leksykon kieszonkowy e-book
- Konrad Jagaciak Python na start. Twórz gry w PyGame! kurs video
- Mateusz Staniak Machine learning i język R. Pierwsze kroki z pakietem mlr kurs video

#
  • 6
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Cześć,

Czy ktoś z was miał okazję pracować z technologią hadoop w kontekście zadań związanych z tematyką Machine Learning ? jeśli tak to jak wyglądał proces tworzenia modeli, obróbki danych od początku rozpoczęcia ciągu technicznego ?

Jak rozumiem Hadoop to jest jakby to powiedzieć ogromny magazyn na przechowywanie dosłownie różnych danych z różnych systemów dane te mogą być ustrukturyzowane, nieustrukturyzowane itp. wchodzą oni to jak dobrze rozumiem przestrzeni HDFS na surowo, i jak wiemy
  • 4
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Hej, orientujecie się moze jakie są średnie zarobki na stanowisku senior BI analyst/R shiny developer ze skillami w SQL(poziom sredniozaawansowany/zaawansowany), R, R shiny (zaawansowany), power BI (podstawowy) i 5 letnim doświadczeniem?

Sprawdzałem już widełki na różnych portalach, ale podobno takie widełki płacowe nie oddają realiów rynkowych (podobno są one zaniżone)

#jezykr #progrmowanie #programista15k #zarobki
  • 7
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Hej #datascience #pracait #jezykr

Pracuję wykorzystując w większości R i właśnie R to pytanie będzie dotyczyć. Mam doświadczenie zawodowe w R około dwóch lat, zajmuje się robieniem ETLowego backendu plus webappki w shiny.

W mojej pracy jest mi bardzo dobrze, to znaczy ciąglę uczę się czegoś nowego, i nikt nie broni mi testować i stosować nowych rozwiązań. Ale brakuje mi kogoś bardziej ogarniętego ode mnie, kto
  • 4
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@yoloBaklawa: gituwa
tylko właśnie wiesz jak to brzmi nie.. a tutaj miałem dwa przedmioty z R, czyli pewnie jakieś podstawy typu poznanie typów danych, jakieś tam obliczenia.. a nagle robisz ETL w R o.O trochę duży przeskok :D no ale widocznie nie jest to takie ciężkie/ty jesteś odpowiednio dobry że ze stosunkowo małym nakładem pracy jesteś w stanie robić fajne rzeczy :)
  • Odpowiedz
@farmaceut: Zależy od zastosowania. Mówienie, że R jest bliźniakiem Pythona to jakieś nieporozumienie. Przede wszystkim Python jest językiem ogólnego zastosowania, a R jest typowo pod statystykę i data science.
  • Odpowiedz
mam dataset w ktorym jest 6 kategorii - wszystkie to factor(3 levele: positive, negative i average). Probuje zbudowac model predykcyjny przy pomocy regresji logistycznej oraz drzewa decyzyjnego ale wychodzą błędy. Wie ktos czy mozna przy takich danych zbudowac takie modele i umialby dac jakis przyklad kodu?
#jezykr #machinelearning #analizadanych
  • 12
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@Pyxelr: one hot to możesz przekodować zmienne tekstowe na zera i jedynki w zbiorach wejściowych, ale regresja logistyczna wyliczy ci wartość między dwoma poziomami a nie trzema czy więcej

można użyć sieci neuronowych i funkcji sofrmax na wyjściu , wtedy jednym modelem załatwiamy 3 prawdopodobieństwa
  • Odpowiedz
Ekosystem języka R jest niezwykle bogaty i nieustannie się rozwija, dlatego niektóre przydatne rzeczy mogą umknąć. Sprawdź, czy znasz wszystkie z 10 rzeczy, które mogą ułatwić Ci pracę w języku R.

https://bulldogjob.pl/news/1051-10-rzeczy-ktore-ulatwia-ci-prace-w-jezyku-r

#jezykr #programowanie #naukaprogramowania
Bulldogjob - Ekosystem języka R jest niezwykle bogaty i nieustannie się rozwija, dlat...

źródło: comment_1586954579kgZLL5qDFiRB8tlnewPXxe.jpg

Pobierz
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Tygodniowe anomalie temperatury powietrza w latach 2011-2020 w Polsce.

Metoda:

- Dla każdej doby w latach 2011-2020 wyliczono anomalię dobową temperatury względem okresu 1981-2010 dla każdej dostępnej stacji (ok. 100 stacji IMGW do listopada 2019, 70 stacji po tym czasie)
- Za pomocą #jezykr wrzucono dane na kriging (dla każdej doby) względem modelu terenu (siatka 4km)
cumulus - Tygodniowe anomalie temperatury powietrza w latach 2011-2020 w Polsce.

M...

źródło: comment_m3raFwKeX1UjCmRhS1WW9Lgbu87I4VnN.jpg

Pobierz
  • 2
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

O skali osi Y.

Skala jest niesymetryczna, bo i absolutne wartości anomalii są niesymetryczne i zawierają się w zakresie -18, +9. Wynika to z czynników adwekcyjnych w zimnej połowie roku, która charakteryzuje się największą wariancją. Wtedy możemy mieć do czynienia z adwekcją ciepłego powietrza pochodzenia atlantyckiego, które może przynosić lokalnie średnie dobowe temperatury powietrza rzędu +10 (i podobne anomalie dobowe), ale możemy mieć również adwekcję powietrza ze wschodu, które ze względu na
  • Odpowiedz
Czy ktoś z Was korzysta ze skryptów R w programie #powerbi. Ja dopiero zaczynam swoją przygodę z Power BI, ale znam R i chciałabym to jakoś wykorzystać. Czy faktycznie Power BI ma ograniczenia co do ilości danych? Pracuję z z danymi, które mają > milion wierszy. Czy Power BI sobie poradzi z taką ilością?

#powerbi #jezykr #analizadanych
  • 2
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@malachite: nie używam R w Power BI ale z tego co wiem to jest limit 150k rows na visual z R + 5 min timeout czyli generalnie jak korzystasz z Desktopa, a nie clouda, to może ci braknąć RAMu.

Dlatego powinnaś przemyśleć koncepcję i zastanowić się na przykład, czy nie możesz sobie przerobić danych w R tak by tylko wyniki zaciągać do Power BI i tworzyć raporty/dashboardy tamże.
  • Odpowiedz
@malachite: "There is no limitation on the rows of data you can import into Power BI currently. However, Power BI offers two licenses, Power BI (free) and Power BI Pro, with different data capacity limits: Free users have a maximum 1 GB data capacity. Pro users of Power BI Pro have 10 GB maximum capacity."
  • Odpowiedz