Jakby chciał ktoś zobaczyć, jak państwo Polskie zredukowało liczbę wydawanych interpretacji podatkowych przez wprowadzenie jednej zmiany, to poniżej link do małej analizy zrobionej w Pythonie (pandas, seaborn, scikit-learn).
https://www.wykop.pl/link/4610335/jak-gaar-wybil-zeby-interpretacjom-podatkowym-w-2016-roku/
#python #programowanie #podatki #prawo #ekonomia
https://www.wykop.pl/link/4610335/jak-gaar-wybil-zeby-interpretacjom-podatkowym-w-2016-roku/
#python #programowanie #podatki #prawo #ekonomia
https://www.wykop.pl/link/4627457/o-co-podatnicy-pytali-w-2017-r-interaktywny-wykres-punktowy/
Pokrótce:
1) interpretacje zostały podzielone na leksemy za pomocą biblioteki Morfeusz (biblioteka #python),
2) następnie na korpusie został zastosowany algorytm TF-IDF (z biblioteki scikit-learn) w celu uzyskania najbardziej charakterystycznych słów,
3) po dokonaniu wyboru 100 najbardziej charakterystycznych słów dla każdej interpretacji, porównałem za pomocą biblioteki scattertext lata 2016 i 2017 za pomocą wskaźnika fscore.
Sam interaktywny wykres punktowy został wykonany w Tableau