#jezykr

20.09.2023, 15:10:03

0

Cześć, zaczynam się uczyć #R i próbuję zrobić wordcloud używając biblioteki wordcloud2. Zauważyłem, że ich przykładowy dataframe jest inny niż mój i zastanawiam się jak powinienem przeprocesować własne dane, żeby wyglądały podobnie pod względem struktury i typu.

#jezykr #programowanie #kiciochpyta
Demo:

kamilm119

20.09.2023, 20:26:00 via Wykop

0

@heniek_8: Hej! Pewnie, że tak być powinno! W badaniu pracowałem nad dwoma wordcloudami, które pokazywały rosyjskie reakcje na newsy. Po rosyjsku 'fake' bylo opisywane różnymi slowami, ale angielskie tłumaczenie wszystko sprowadziło fo 'fake' właśnie. Nie mam problemu z tym, zeby to naprawić - pytam o coś zupełnie innego.

Jak widac po moich danych to one wygladają mniej więcej tak

[1] słowo1 numer1
[2]

heniek_8

21.09.2023, 04:01:08 via Wykop

0

masz tam row.names, od których obecnie się odchodzi (np tibble i data.table tego nie wspierają)

library(dplyr)
demoFreq = data.frame ( word = c('oil','said','prices'), freq=c(85, 73, 48))
row.names(demoFreq) = demoFreq$word

head(demoFreq)

Kaczus2B

14.09.2023, 22:07:39

1

Zainteresowanych #mirkopromocje zainteresować może fakt, ze w najbliższych dniach księgarnia Helion obchodzić będzie okrągłe 32 urodziny. Świętowanie zaczyna od rozdawnictwa - w zamian za zapisanie się na newslettera księgarni, możemy otrzymać e-booka bądź jeden z 2 kursów video:

- Witold Wrotek Elektronika. Leksykon kieszonkowy e-book
- Konrad Jagaciak Python na start. Twórz gry w PyGame! kurs video
- Mateusz Staniak Machine learning i język R. Pierwsze kroki z pakietem mlr kurs video

#

arysto2011

15.09.2023, 02:30:56 via Wykop

2

@heniek_8: R jak octave albo Julia

saviola7

15.09.2023, 05:24:46 via Wykop

3

że ktoś jeszcze pamięta o R

@heniek_8: Nadal jest używany przez Data Scientistów.

printHelloWorld

20.11.2022, 20:42:30

0

Cześć,

Czy ktoś z was miał okazję pracować z technologią hadoop w kontekście zadań związanych z tematyką Machine Learning ? jeśli tak to jak wyglądał proces tworzenia modeli, obróbki danych od początku rozpoczęcia ciągu technicznego ?

Jak rozumiem Hadoop to jest jakby to powiedzieć ogromny magazyn na przechowywanie dosłownie różnych danych z różnych systemów dane te mogą być ustrukturyzowane, nieustrukturyzowane itp. wchodzą oni to jak dobrze rozumiem przestrzeni HDFS na surowo, i jak wiemy

Hadzik

20.11.2022, 21:08:57

0

@printHelloWorld: zależy jaki ML, do niektórych klasycznych modeli Spark + Spark MLlib jest wystarczający

printHelloWorld

17.12.2022, 18:46:54

0

@Hadzik: Cześć, sorki za odpisanie dopiero teraz, zależy na tworzeniu modelu prognozujących pewne sytuację. Czy masz może jakiś fajny diagram opisujący ML w kontekście Hadoop ?

printHelloWorld

24.10.2022, 19:36:32

0

Cześć,

Znacie jakieś fajne materiały odpisujące działanie modelu od środka ? tymi materiałami mogą być książki, filmiki, podcasty itp

Nie interesuje mnie same przygotowanie danych, ale to w jaki sposób dostrajać, modyfikować model wewnątrz.

#machinelearning #datascience #python #jezykr

printHelloWorld

25.10.2022, 12:49:13

0

@JebawczanRysionu: nie no to wiem ale modele jak np drzewa decyzyjne, losowe lasy maja swoje parametry ktore mozna regulowac aby dostac lepszy wynik, i chciałabym znalezc lekture ktora o tym mowi jaki model, jaki parametr itp

printHelloWorld

28.10.2022, 05:16:40

0

Czekam na sugestie :) #machinelearning #python #datascience

wojnar91

11.10.2022, 07:58:53

0

Hej, orientujecie się moze jakie są średnie zarobki na stanowisku senior BI analyst/R shiny developer ze skillami w SQL(poziom sredniozaawansowany/zaawansowany), R, R shiny (zaawansowany), power BI (podstawowy) i 5 letnim doświadczeniem?

Sprawdzałem już widełki na różnych portalach, ale podobno takie widełki płacowe nie oddają realiów rynkowych (podobno są one zaniżone)

#jezykr #progrmowanie #programista15k #zarobki

wojnar91

11.10.2022, 09:35:53

4

@KOLEGAMAMY: Uważasz, że odpowiedź typu 'minimalna + 200 zł' wnosi coś do dyskusji?

E.....e

konto usunięte 11.10.2022, 12:31:20

1

@wojnar91: na R jest znacznie mniej ofert niz na Pythona, ale z takim expem to bym na pewno ponizej 20k nie schodzil na rozmowach

wytrzzeszcz

08.04.2022, 08:33:51

0

Zrobiłem listę 64 różnych języków programowania i w tagu:
#bitwyjezykowe
będziemy sobie je porównywać który lepszy
W lewym narożniku #jezykr znane narzędzie dla statystyków
W prawym narożniku #rustlang kolejna próba detronizacji C
głosowanie plusami w kometarzach

wytrzzeszcz

08.04.2022, 08:33:59

25

wybieram
R

wytrzzeszcz

08.04.2022, 08:34:07

42

Wybieram
Rust

wytrzzeszcz

06.04.2022, 19:34:10

0

#bitwyjezykowe
będziemy sobie je porównywać który lepszy
W lewym narożniku #jezykr Język R jest językiem do przetwarzania danych statystycznych
W prawym narożniku #rpg kolejny dinozaur pracujacy na komputerach klasy mainframe
głosowanie plusami w kometarzach

wytrzzeszcz

06.04.2022, 19:34:18

22

wybieram
R

wytrzzeszcz

06.04.2022, 19:34:28

6

wybieram
RPG

F.....r

konto usunięte 21.10.2021, 19:35:01

1

Mógłby ktoś polecić / podlinkować jakiś darmowy kurs i przy okazji zestaw prostych ćwiczeń / prostych projektów ( razem z rozwiązaniami ) z #jezykr? Najlepiej pod kątem analizy danych.
Stawiam kilka świetnych piw kraftowych w zamian za pomoc :)
#pracbaza #programista15k #it #programowanie #pracait

Ark00

21.10.2021, 20:24:34

1

Jak będziesz na północy Polski to pisz

@FailureMaster: o panie, ciężka sprawa ( ͡° ͜ʖ ͡°)

Tasartico7

21.10.2021, 20:32:25 via Wykop Mobilny (Android)

1

@FailureMaster: ja kiedyś zrobiłem parę kursów z tej specjalizacji, polecam: https://www.coursera.org/specializations/jhu-data-science

yoloBaklawa

20.10.2021, 06:16:58

2

Hej #datascience #pracait #jezykr

Pracuję wykorzystując w większości R i właśnie R to pytanie będzie dotyczyć. Mam doświadczenie zawodowe w R około dwóch lat, zajmuje się robieniem ETLowego backendu plus webappki w shiny.

W mojej pracy jest mi bardzo dobrze, to znaczy ciąglę uczę się czegoś nowego, i nikt nie broni mi testować i stosować nowych rozwiązań. Ale brakuje mi kogoś bardziej ogarniętego ode mnie, kto

mrocznapszczola

20.10.2021, 08:33:01

1

Zacznij robić PR do open sourcowych rozwiązań.

peoplearestrange

20.10.2021, 14:36:48

0

@yoloBaklawa: gituwa
tylko właśnie wiesz jak to brzmi nie.. a tutaj miałem dwa przedmioty z R, czyli pewnie jakieś podstawy typu poznanie typów danych, jakieś tam obliczenia.. a nagle robisz ETL w R o.O trochę duży przeskok :D no ale widocznie nie jest to takie ciężkie/ty jesteś odpowiednio dobry że ze stosunkowo małym nakładem pracy jesteś w stanie robić fajne rzeczy :)

r-evolve

06.11.2020, 22:25:50

0

byłby ktoś w stanie pomóc w zadaniu z R ze statystyki? podstawy podstaw, dopiero raczkuję w temacie
#jezykr #programowanie #naukaprogramowania

ChamskoCytuje

06.11.2020, 22:29:50

2

@r-evolve: 200zl

ChamskoCytuje

06.11.2020, 22:34:44

11

@r-evolve: ja tez biedny, ale R znam ( ͡° ͜ʖ ͡°)

farmaceut

05.11.2020, 08:01:53

13

Język R to upośledzony brat bliźniak Pythona, po innym ojcu (Bashu). Python + Numpy + Scipy + Pandas > nic > język R.

#programowanie #naukaprogramowania #programista15k #python #jezykr #takaprawda

JSkrzetuski

05.11.2020, 08:05:49 via Android

21

@farmaceut zostaw R w spokoju

rmweb

05.11.2020, 09:42:30

13

@farmaceut: Zależy od zastosowania. Mówienie, że R jest bliźniakiem Pythona to jakieś nieporozumienie. Przede wszystkim Python jest językiem ogólnego zastosowania, a R jest typowo pod statystykę i data science.

ukruszony__kubek

08.06.2020, 16:00:31

0

mam dataset w ktorym jest 6 kategorii - wszystkie to factor(3 levele: positive, negative i average). Probuje zbudowac model predykcyjny przy pomocy regresji logistycznej oraz drzewa decyzyjnego ale wychodzą błędy. Wie ktos czy mozna przy takich danych zbudowac takie modele i umialby dac jakis przyklad kodu?
#jezykr #machinelearning #analizadanych

heniek_8

08.06.2020, 16:51:02

3

@ukruszony__kubek: jak chcesz użyć regresję logistyczną, to chyba kilka modeli one vs rest musisz przygotować

heniek_8

08.06.2020, 19:36:37

2

@Pyxelr: one hot to możesz przekodować zmienne tekstowe na zera i jedynki w zbiorach wejściowych, ale regresja logistyczna wyliczy ci wartość między dwoma poziomami a nie trzema czy więcej

można użyć sieci neuronowych i funkcji sofrmax na wyjściu , wtedy jednym modelem załatwiamy 3 prawdopodobieństwa

Swepp

04.06.2020, 09:18:52

0

Jak najlepiej nauczyć się samemu języka R do analizy danych? Są jakieś dobre książki/tutoriale/kursy?

#programowanie #jezykr #analizadanych #informatyka

ukruszony__kubek

04.06.2020, 09:22:51

4

@Swepp: udemy, data camp

matti05

04.06.2020, 09:28:38

4

@Swepp: http://pogromcydanych.icm.edu.pl/
Kurs stary, ale na totalne podstawy często polecany. Z polskich pozycji to generalnie Biecek jest dobry.

Bulldogjob

15.04.2020, 12:43:02

3

Ekosystem języka R jest niezwykle bogaty i nieustannie się rozwija, dlatego niektóre przydatne rzeczy mogą umknąć. Sprawdź, czy znasz wszystkie z 10 rzeczy, które mogą ułatwić Ci pracę w języku R.

https://bulldogjob.pl/news/1051-10-rzeczy-ktore-ulatwia-ci-prace-w-jezyku-r

#jezykr #programowanie #naukaprogramowania

Bulldogjob - Ekosystem języka R jest niezwykle bogaty i nieustannie się rozwija, dlat... — **źródło:** comment_1586954579kgZLL5qDFiRB8tlnewPXxe.jpg
Pobierz

konik_polanowy

29.01.2020, 09:17:34

7

Dzisiaj Hands-On Data Science with R (November 2018)

https://www.packtpub.com/packt/offers/free-learning

#packtpubfreelearning #jezykr #datascience

odpowiedź

konik_polanowy

29.01.2020, 09:18:07

0

TymRazemNieBedeBordo

29.01.2020, 10:44:15

1

@konik_polanowy: dziekuje :)

cumulus

16.01.2020, 19:01:52

5

Tygodniowe anomalie temperatury powietrza w latach 2011-2020 w Polsce.

Metoda:

- Dla każdej doby w latach 2011-2020 wyliczono anomalię dobową temperatury względem okresu 1981-2010 dla każdej dostępnej stacji (ok. 100 stacji IMGW do listopada 2019, 70 stacji po tym czasie)
- Za pomocą #jezykr wrzucono dane na kriging (dla każdej doby) względem modelu terenu (siatka 4km)

cumulus

16.01.2020, 19:11:16

0

O skali osi Y.

Skala jest niesymetryczna, bo i absolutne wartości anomalii są niesymetryczne i zawierają się w zakresie -18, +9. Wynika to z czynników adwekcyjnych w zimnej połowie roku, która charakteryzuje się największą wariancją. Wtedy możemy mieć do czynienia z adwekcją ciepłego powietrza pochodzenia atlantyckiego, które może przynosić lokalnie średnie dobowe temperatury powietrza rzędu +10 (i podobne anomalie dobowe), ale możemy mieć również adwekcję powietrza ze wschodu, które ze względu na

cumulus

16.01.2020, 19:15:34

1

*Rekord maksymalnej dobowej temperatury = -26 w Suwałkach

lolek24

18.11.2019, 15:59:21

1

library(tidyverse)
library(urltools)
library(fs)
library(dplyr)

History_file <-fs::path(Sys.getenv("USERPROFILE"),

lolek24

18.11.2019, 21:11:46

0

@heniek_8: Ucina znaki _
https://gist.github.com/lolek24/3ec99a3a8b661d2b6b377ab27a68e541

lemur_78

23.11.2019, 20:02:00 via Wykop Mobilny (Android)

0

@lolek24: o, widzę mój kod :D
https://m.facebook.com/story.php?story_fbid=2250463131910841&substory_index=0&id=1775448726078953

malachite

03.10.2019, 10:50:54

0

Czy ktoś z Was korzysta ze skryptów R w programie #powerbi. Ja dopiero zaczynam swoją przygodę z Power BI, ale znam R i chciałabym to jakoś wykorzystać. Czy faktycznie Power BI ma ograniczenia co do ilości danych? Pracuję z z danymi, które mają > milion wierszy. Czy Power BI sobie poradzi z taką ilością?

#powerbi #jezykr #analizadanych

m.....i

konto usunięte 03.10.2019, 11:01:41

2

@malachite: nie używam R w Power BI ale z tego co wiem to jest limit 150k rows na visual z R + 5 min timeout czyli generalnie jak korzystasz z Desktopa, a nie clouda, to może ci braknąć RAMu.

Dlatego powinnaś przemyśleć koncepcję i zastanowić się na przykład, czy nie możesz sobie przerobić danych w R tak by tylko wyniki zaciągać do Power BI i tworzyć raporty/dashboardy tamże.

karpadoor

03.10.2019, 14:17:27

0

@malachite: "There is no limitation on the rows of data you can import into Power BI currently. However, Power BI offers two licenses, Power BI (free) and Power BI Pro, with different data capacity limits: Free users have a maximum 1 GB data capacity. Pro users of Power BI Pro have 10 GB maximum capacity."