Wpis z mikrobloga

Mirki, mam taki #csv

[TimeStamp], [Open], [Close], [High], [Low], [Volume], [BaseVolume]
8/14/2015 9:06:00 AM,0.00690000,0.00690000,0.00690000,0.00690000,1.34611713,0.00928820

Jak to wczytac w #r #rstudio ?

#statystyka #datascience
  • 9
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@scyth: @grajlord: w pracy korzystam na codzien z pythona, ale podoba mi sie mnogosc swietnych bibliotek w R. Myslicie, ze jest sens sie tego, czy lepiej szukac pythonowych zamiennikow? Super jest jeszcze #julia, ale do tego bibliotek nie ma prawie wcale niestety
  • Odpowiedz
@erwit: na pewno warto, w razie czego wołaj. W zeszłym roku R zanotował duży wzrost i raczej się będzie utrzymywać, jest to popularny „naukowy” język i do tego dość prosty. Dla mnie najtrudniej było się odzwyczaić od pętli - w R niemal ich nie potrzebujesz, jeszcze jak dodasz do swoich umiejętności dplyr to w ogóle.
  • Odpowiedz
@erwit: Nie wiem przy czym pracujesz, to nie wiem czy jest sens, ale jeżeli robisż cokolwiek związanego ze statystyką/modelowaniem/machine learningiem a nawet w sumie samym przekształcaniu tabel/macierzy, to R wypadałoby znać.

W odróżnieniu od Pythona R jest językiem funkcyjnym, a nie stricte obiektowym, metody należą tu do funkcji, i to może na początek razić. Na szczęście pipe operator %>% z tidyverse/dplyr daje namiastkę OOP. Co prawda obiekty dalej nie są modyfikowane w miejscu, ale jest to moim zdaniem porządane w sytuacji, gdy musisz te same dane wielokrotnie modyfikować na różne sposoby.

Niestety dla R nie ma czegoś takiego jak PEP i w każdej paczce obiekty/funkcje nazywane są wg innej konwencji, równolegle istnieje kilka stylów OOP (S3, S4, RC, R5 i jeszcze kilka innych), ale S3 + tidyverse jest chyba najpopularniejsze do zastosowań statystycznych.
R ma też bardzo wygodne konstrukcje zastępujące pętle - z "base R": lapply etc; z "plyr": ldply etc; z "dplyr": map, group_by() %>% do(). Dzięki temu można szybko oskryptować bardzo rozbudowaną analizę, zamykając to w
  • Odpowiedz