Wpis z mikrobloga

Skopiuj link

25.05.2018, 18:37:24

Hej mirki. Jako że jestem newbie w #machinelearning każda wskazówka się przyda.

Staram się posortować bardzo dużą liczbę koncertów po ich estymowanych wpływach biletowych. Pojedynczy wektor danych zawiera podstawowo:

- ID koncertu,
- ID obiektu / lokalizacji
- ID artysty-wykonawcy

Poza tym dla niewielkiej części wektorów mogę przypisać zmienną, której szukam, czyli realne wpływy koncertowe. Jakieś pomysły?

Wiem, że jest to do zrobienia, bo w godzinę "na kolanie" (tj. w excelu...), stosując bardzo proste algorytmy iteracyjne i informacje o wielkości obiektu koncertowego (maksymalna widownia - z Wikipedii), udało mi się całkiem ładnie te dane posortować. Myślę, że stosując bardziej eleganckie i zaawansowane narzędzia, wyniki mogą być naprawdę niezłe.

Jakieś pomysły?

#analizadanych #bigdata #datascience #datamining

Cronox

dziobaki_sa_jadowite

25.05.2018, 18:52:13

@neko90: Ale co chcesz zrobić? Chcesz znaleźć dane w necie o przychodach? Chcesz wyestymować na podstawie tych 3 danych wpływy (swoją drogą co to znaczy że masz ID - rozumiem że to tylko jakiś klucz do bazy danych, a nie jakaś wartość)?

neko90

dziobaki_sa_jadowite

25.05.2018, 18:56:45

Komentarz usunięty przez autora

neko90

25.05.2018, 19:01:43

Dane o wpływach biletowych dla części koncertów już mam (ok 3 tys. z ostatnich paru lat) i jestem w trakcie matchowania ich z kluczem głównym wydarzenia. Teraz staram się oszacować wpływy tych, do których danych nie mam.

Co do wektora danych - mam więcej niż te trzy wymienione (choćby współrzędne geograficzne czy data koncertu), ale raczej nie są skorelowane z wpływami biletowymi. Te trzy jak wielkość obiektu i wykonawca rzecz jasna są

croppz

25.05.2018, 19:27:37

@neko90: python, scikit learn i pobaw się algorytmami. Koncerty dla których masz wpływy dzielisz na dwie grupy, training i test, najlepiej funkcją traintestsplit, w proporcjach na przykład 80:20. Samo korzystanie z modeli jest bardzo proste, do tego jeszcze pod większością z nich są przykłady. Możesz zacząć na przykład od SVR.

EDIT: kurna, link się zepsuł ( ͡° ʖ̯ ͡°)

A w ogóle to miras, podziel

neko90

Aktywne Wpisy

njdnsjdnjs

njdnsjdnjs +21

4 godz. i 54 min temu

mam takie fazy na jedzenie, które mogłabym jeść codziennie i tylko to i aż do porzygu. były to ostatnio:
- parówki (ok. 2 miesiące, to był twardy zawodnik, jadłam w każdej konfiguracji i zestawieniu i nawet nie mam ich tak bardzo dość)
- jajecznica
- kinderki
- wędlina sopocka
Aktualnie jest to lazania z Auchana. ja się już nawet nie powstrzymuje. moje myśli krążą tylko wokół niej. ciekawe co będzie następne.