Wpis z mikrobloga

Chciałbym napisać coś co dokonuje przyporządkowania transakcji z banku do jakichś kategorii, taguje mi te transakcje co mógłbym poprawiać i na tej podstawie dla kolejnych transakcji wyciągałoby wnioski jakieś. To chyba się nazywa #machinelearning :)

Jak się do tego zabrać? Wejście to plik CSV wygenerowany z banku, obecnie wrzucam go sobie do #spendee i ręcznie robię przyporządkowanie do kategorii, ale są tam różne wzorce typu że w lidlu to raczej robię spożywcze, gdzieś tam kosmetyki, z play mam rachunki, jak koło południa to pewnie jakiś obiadek na mieście

Preferuję #java ale niczego się nie boję :) (tak idę na łatwiznę zadając pytanie tutaj)
  • 6
@zgredinho: Mam listę transakcji i teraz je ręcznie przyporządkowuję do kategorii. Ale robię nowe transakcje cały czas :). Chciałbym program, który na podstawie tych danych które już mam (oczywiście trzeba je odpowiednio obrobić) byłby w stanie stwierdzić z jakimś prawdopodobieństwem że dana transakcja to zakupy spożywcze. No i ja bym później akceptował taki wynik, a on przy kolejnym wrzucie transakcji byłby użyty do wnioskowania.
@KotoFan: generalnie ciężko, te dane które sam wygenerujesz to może być za mało dla algorytmu...
ale chcesz coś takiego, że płacisz kartą w lidlu oznaczasz to jako spożywka i potem ten twój program ma z automatu każdą transakcję w lidlu oznaczać jako spożywkę czy też inne sklepy których jeszcze nigdy nie zaklasyfikowałeś?
zrób count na tej kolumnie w której jest opis transakcji i idąc od góry (najczęściej występujących) pisz warunki
if lowcase(opis) contains '%lidl%' then kategoria = 'spożywka' ;
else if lowcase(opis) contains '%alko%' then kategoria = 'chlanie';
else if ...
itd