Wpis z mikrobloga

Mam bazę użytkowników ≈50mln i teraz chciałbym z nich wyciągnąć ,,rodzynki". Czy jest możliwe, żeby skrypt na podstawie moich wyborów doszukiwał mi podobne pozycje, a gdy uznam że jest ok, sam się doskonalił jak wskarze mu błędy? Jeśli mam wiele źródeł danych które zmieniają się z godziny na godzinę, jak mogę to ,,ogarnąć"? Czy studenci chętnie pracują za % od zysków? #studbaza #datascience #programowanie
  • 14
via Wykop Mobilny (Android)
  • 0
@jazmojegopokoju: Zapoznaj się z tematem klasyfikacji i algorytmów knn. Idea jest taka, że dla każdego elementu ze zbioru (uczącego) przypisujesz pewne informacje, np jak chcesz rozpoznać kwiaty, to mogą być dane typu wielkość płatka, liscia, kolor płatka itp. Potem będziesz klasyfikował resztę danych na podstawie tego zbioru.
@define może proponujesz dobrą metodę ale nie wiem czy do końca rozumiesz metody analizy skupień ( ͡° ʖ̯ ͡°).
@jazmojegopokoju trochę słabo wytłumaczyłeś problem, masz te swoje rodzynki i co? jak te rodzynkowe wektory wyglądają? Czy to są bardziej rodzynkowe-wektory ciągłe, dyskretne może trochę tego, trochę tego.
Rodzynkowe wektory dyskretne to takie: [0,1,5,2, ...]
Rodzynkowe wektory ciągłe to takie: [1,44234, 11,13, 66,242, ...]
I teraz tak jak, co