Aktywne Wpisy

wscieklykabanos +824
#polskiedrogi To naturalna sytuacja.
Kto po jeździe slalomem nie zjeżdża na parking i nie zaczyna walić wódy, niech pierwszy rzuci kamieniem.
Kto po jeździe slalomem nie zjeżdża na parking i nie zaczyna walić wódy, niech pierwszy rzuci kamieniem.
źródło: HAbISwEXYAAySJt
Pobierz
Treść przeznaczona dla osób powyżej 18 roku życia...





Mam zadanie w pracy, z okolo 300 zapytan o informacje przychodzacych do firmy, wytypowac okolo 10 najczesciej wystepujacych. Zapytania przychodza do nas w postaci krotkiej wiadomosci mailowej niestaty nie sa standarwowe, czasm pytaja sie o jedna rzecz czasem o piec. Czasem jedno zdanie czasem lista. Wypakowalem wszystkie maile do plikow textowych i zastanawiam sie jak to teraz oporzadzic. Z dostepnych narzedzie na kompie w pracy tylko Excel :( Co poradzicie? Jak to ogarnac?
@shodan56
och, nie chce tego robic recznie :( Juz bym w VBA w Excelu wczytal wszystkie wiadomosci do jednego arkusza (np w jedna kolumne) wrzucam kazde slowo do kolejnego wiersza w tej kolumnie az do konca wiadomosci, w tym samym czasie jak je wczytuje to w drugiej kolumnie kazdemu slowu danej wiadomosci nadaje unikalny numer. Wiec kazde slowo wczytane z wiadomosci 1, bedzie miec nadany numer 1. Dla
No, ale Excel...
@Bratek: to już blisko do LDA właśnie. W ten sposób tworzysz macierz DTM (document-term-matrix) czy tam TDM (term-document-matrix). Reszta to jakieś logarytmy zdaje się, trzeba doczytać.