O co podatnicy pytali w 2017 r.? Interaktywny wykres punktowy
Krótkie podsumowanie zastosowania TF-IDF w analizie interpretacji indywidualnych, a konkretnie różnic tematycznych pomiędzy interpretacjami indywidualnym z zakresu podatku CIT wydanymi w roku 2017 a tymi udzielonymi w roku 2016.
aleteior z- #
- #
- #
- #
- #
- 9
- Odpowiedz
Komentarze (9)
najlepsze
@PC86: Raczę poczytać jak działa TF-IDF wtedy, wyjaśni się dlaczego nie ma "i" ;)
https://aleteior.pl/wykorzystanie-tf-idf-w-analizie-interpretacji-podatkowych-czyli-jak-gaar-wybil-zeby-interpretacjom-podatkowym-w-2016-roku/
" Jaka stawka podatku za pracę zarobkową cyganów"
Jeśli masz lepszy algorytm, to będę wdzięczny za podesłanie inspiracji ;)
Częściowo TF-IDF wykorzystuje funkcję "count", ale dalsza jego część (ta "logarytmiczna") jest trochę bardziej złożona. Ma ona selekcjonować słowa najbardziej charakterystyczne dla każdego dokumentu. Charakterystyczne, czyli najbardziej odróżniające go od całego korpusu dokumentów, których ów dokument jest częścią.
W ten sposób można stwierdzić, że stosunkowo więcej interpretacji o uldze badawczo-rozwojowej było w roku 2017 niż 2016 r.