@heniek_8: Hej! Pewnie, że tak być powinno! W badaniu pracowałem nad dwoma wordcloudami, które pokazywały rosyjskie reakcje na newsy. Po rosyjsku 'fake' bylo opisywane różnymi slowami, ale angielskie tłumaczenie wszystko sprowadziło fo 'fake' właśnie. Nie mam problemu z tym, zeby to naprawić - pytam o coś zupełnie innego.

Jak widac po moich danych to one wygladają mniej więcej tak

[1] słowo1 numer1
[2] słowo2 numer2

Natomiast przykładowy dataset wygląda inaczej i
masz tam row.names, od których obecnie się odchodzi (np tibble i data.table tego nie wspierają)

library(dplyr)
demoFreq = data.frame ( word = c('oil','said','prices'), freq=c(85, 73, 48))
row.names(demoFreq) = demoFreq$word

head(demoFreq)
Zainteresowanych #mirkopromocje zainteresować może fakt, ze w najbliższych dniach księgarnia Helion obchodzić będzie okrągłe 32 urodziny. Świętowanie zaczyna od rozdawnictwa - w zamian za zapisanie się na newslettera księgarni, możemy otrzymać e-booka bądź jeden z 2 kursów video:

- Witold Wrotek Elektronika. Leksykon kieszonkowy e-book
- Konrad Jagaciak Python na start. Twórz gry w PyGame! kurs video
- Mateusz Staniak Machine learning i język R. Pierwsze kroki z pakietem mlr kurs video
Cześć,

Czy ktoś z was miał okazję pracować z technologią hadoop w kontekście zadań związanych z tematyką Machine Learning ? jeśli tak to jak wyglądał proces tworzenia modeli, obróbki danych od początku rozpoczęcia ciągu technicznego ?

Jak rozumiem Hadoop to jest jakby to powiedzieć ogromny magazyn na przechowywanie dosłownie różnych danych z różnych systemów dane te mogą być ustrukturyzowane, nieustrukturyzowane itp. wchodzą oni to jak dobrze rozumiem przestrzeni HDFS na surowo, i
@#!$%@?: nie no to wiem ale modele jak np drzewa decyzyjne, losowe lasy maja swoje parametry ktore mozna regulowac aby dostac lepszy wynik, i chciałabym znalezc lekture ktora o tym mowi jaki model, jaki parametr itp
Hej, orientujecie się moze jakie są średnie zarobki na stanowisku senior BI analyst/R shiny developer ze skillami w SQL(poziom sredniozaawansowany/zaawansowany), R, R shiny (zaawansowany), power BI (podstawowy) i 5 letnim doświadczeniem?

Sprawdzałem już widełki na różnych portalach, ale podobno takie widełki płacowe nie oddają realiów rynkowych (podobno są one zaniżone)

#jezykr #progrmowanie #programista15k #zarobki
Hej #datascience #pracait #jezykr

Pracuję wykorzystując w większości R i właśnie R to pytanie będzie dotyczyć. Mam doświadczenie zawodowe w R około dwóch lat, zajmuje się robieniem ETLowego backendu plus webappki w shiny.

W mojej pracy jest mi bardzo dobrze, to znaczy ciąglę uczę się czegoś nowego, i nikt nie broni mi testować i stosować nowych rozwiązań. Ale brakuje mi kogoś bardziej ogarniętego ode mnie, kto zrobiłby code review itp.

Podpowiedzcie proszę,
@yoloBaklawa: gituwa
tylko właśnie wiesz jak to brzmi nie.. a tutaj miałem dwa przedmioty z R, czyli pewnie jakieś podstawy typu poznanie typów danych, jakieś tam obliczenia.. a nagle robisz ETL w R o.O trochę duży przeskok :D no ale widocznie nie jest to takie ciężkie/ty jesteś odpowiednio dobry że ze stosunkowo małym nakładem pracy jesteś w stanie robić fajne rzeczy :)
@Pyxelr: one hot to możesz przekodować zmienne tekstowe na zera i jedynki w zbiorach wejściowych, ale regresja logistyczna wyliczy ci wartość między dwoma poziomami a nie trzema czy więcej

można użyć sieci neuronowych i funkcji sofrmax na wyjściu , wtedy jednym modelem załatwiamy 3 prawdopodobieństwa
Dzisiaj Hands-On Data Science with R (November 2018)

https://www.packtpub.com/packt/offers/free-learning

#packtpubfreelearning #jezykr #datascience

odpowiedź dlaczego nie możesz pobrać "nowych" książek

pdfy/epub/kindle są dostępne dla pozycji zgarniętych za darmo do końca 2018. Nowe pozycje wchodzą tylko na readera. Jeśli coś macie zgarniętego wcześniej a pozycja pojawia się ponownie, to w "moje ebooki" pojawi się dwa razy, raz z pobieraniem a raz tylko z readerea
konik_polanowy - Dzisiaj Hands-On Data Science with R (November 2018)

https://www....

źródło: comment_5rktmdecjunnSGS3Qhvrm0UzF3kfWdQZ.jpg

Pobierz
Tygodniowe anomalie temperatury powietrza w latach 2011-2020 w Polsce.

Metoda:

- Dla każdej doby w latach 2011-2020 wyliczono anomalię dobową temperatury względem okresu 1981-2010 dla każdej dostępnej stacji (ok. 100 stacji IMGW do listopada 2019, 70 stacji po tym czasie)
- Za pomocą #jezykr wrzucono dane na kriging (dla każdej doby) względem modelu terenu (siatka 4km)
- Wartość dobowa to średnia obszarowa z wyniku (raster przycięty do szejpa PL)
- Wykres to
cumulus - Tygodniowe anomalie temperatury powietrza w latach 2011-2020 w Polsce.

M...

źródło: comment_m3raFwKeX1UjCmRhS1WW9Lgbu87I4VnN.jpg

Pobierz
O skali osi Y.

Skala jest niesymetryczna, bo i absolutne wartości anomalii są niesymetryczne i zawierają się w zakresie -18, +9. Wynika to z czynników adwekcyjnych w zimnej połowie roku, która charakteryzuje się największą wariancją. Wtedy możemy mieć do czynienia z adwekcją ciepłego powietrza pochodzenia atlantyckiego, które może przynosić lokalnie średnie dobowe temperatury powietrza rzędu +10 (i podobne anomalie dobowe), ale możemy mieć również adwekcję powietrza ze wschodu, które ze względu na
library(tidyverse)
library(urltools)
library(fs)
library(dplyr)

History_file <-fs::path(Sys.getenv("USERPROFILE"),
"AppData/Local/Google/Chrome/User Data/Default/History")

History_file

Database_file <- dplyr::src_sqlite(History_file)

df <- tbl(Database_file, 'urls') %>% collect() %>%
mutate(domain = urltools::domain(url))

df %>% count(domain) %>%top_n(30, n) %>%
mutate(domain = fct_reorder(domain, n)) %>%
ggplot() + geom_col(aes(domain, n)) + coord_flip()

#datascience #jezykr #programowanie
lolek24 - library(tidyverse)
library(urltools)
library(fs)
library(dplyr)

Histo...

źródło: comment_uL5Fw597EIlXP2CtTgji8kk0w4afA7LZ.jpg

Pobierz
Czy ktoś z Was korzysta ze skryptów R w programie #powerbi. Ja dopiero zaczynam swoją przygodę z Power BI, ale znam R i chciałabym to jakoś wykorzystać. Czy faktycznie Power BI ma ograniczenia co do ilości danych? Pracuję z z danymi, które mają > milion wierszy. Czy Power BI sobie poradzi z taką ilością?

#powerbi #jezykr #analizadanych
@malachite: nie używam R w Power BI ale z tego co wiem to jest limit 150k rows na visual z R + 5 min timeout czyli generalnie jak korzystasz z Desktopa, a nie clouda, to może ci braknąć RAMu.

Dlatego powinnaś przemyśleć koncepcję i zastanowić się na przykład, czy nie możesz sobie przerobić danych w R tak by tylko wyniki zaciągać do Power BI i tworzyć raporty/dashboardy tamże.
@malachite: "There is no limitation on the rows of data you can import into Power BI currently. However, Power BI offers two licenses, Power BI (free) and Power BI Pro, with different data capacity limits: Free users have a maximum 1 GB data capacity. Pro users of Power BI Pro have 10 GB maximum capacity."
Dzisiaj SQL Server 2017 Machine Learning Services with R (February 2018)

https://www.packtpub.com/packt/offers/free-learning

#packtpubfreelearning #sql #machinelearning #jezykr #datascience

odpowiedź dlaczego nie możesz pobrać "nowych" książek

pdfy/epub/kindle są dostępne dla pozycji zgarniętych za darmo do końca 2018. Nowe pozycje wchodzą tylko na readera. Jeśli coś macie zgarniętego wcześniej a pozycja pojawia się ponownie, to w "moje ebooki" pojawi się dwa razy, raz z pobieraniem a raz tylko z readerem
konik_polanowy - Dzisiaj SQL Server 2017 Machine Learning Services with R (February 2...

źródło: comment_oZvIBAV0aMLsbuEAwih4xX2WzvQaolyn.jpg

Pobierz