Wpis z mikrobloga

dlaczego masz słowo freq tyle razy? nie powinno być unikalne? ( + freq liczba wystąpień)?

library (dplyr)
nowy = stary %>% group_by (word = text) %>% summarize ( freq = sum(freq))
@heniek_8: Hej! Pewnie, że tak być powinno! W badaniu pracowałem nad dwoma wordcloudami, które pokazywały rosyjskie reakcje na newsy. Po rosyjsku 'fake' bylo opisywane różnymi slowami, ale angielskie tłumaczenie wszystko sprowadziło fo 'fake' właśnie. Nie mam problemu z tym, zeby to naprawić - pytam o coś zupełnie innego.

Jak widac po moich danych to one wygladają mniej więcej tak

[1] słowo1 numer1
[2] słowo2 numer2

Natomiast przykładowy dataset wygląda inaczej i
masz tam row.names, od których obecnie się odchodzi (np tibble i data.table tego nie wspierają)

library(dplyr)
demoFreq = data.frame ( word = c('oil','said','prices'), freq=c(85, 73, 48))
row.names(demoFreq) = demoFreq$word

head(demoFreq)