Wpis z mikrobloga

Mirki z #programowanie, tworzę aplikację, której celem jest pobieranie postów z fanpejdża i cos tam coś tam. Jednym z punktów, który muszę poruszyć to filtrowanie contentu tych postów pod względem wulgaryzmów i ewentualnie jakichś słów niepożądanych. Wiadomix, że klasycznie jeżeli post zawiera jakieś słowo z listy zakazanych to się je wyłapie natychmiast, ale co w przypadku pokemonów, które przedłużają te słowa powtarzając literę, albo zastępują jakieś litery znaczkami, czy celowo robią literówkę. Macie doświadczenie przy implementowaniu takich rozwiązań lub chociaż jakieś docsy o tym?
  • 4
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@wczoraj: jestem świadomy tego, ze 100. procentowej skutecznosci nie wyrobię, ale moze ktoś tworzył cos podobnego i jest w stanie podrzucić jakies pomysły poza sprawdzaniem istnienia danego słowa, bo to trochę banalne.
  • Odpowiedz
  • 0
@e7450 powtarzanie akurat proste :) eliminuj litery koło siebie i rób dopasowanie. Kolejno możesz podmieniać znaki, które są wstawiane zamiast wkasciwych, np a zamiast @. Inaczej nie bardzo wiem jak (poza tym co wspomniano wczesniej). Patrzyłem na Napiprojekt i tam jest txt z listą wulgaryzmów. Nie wiem tylko czy dopasowują 1:1 czy mają jakąś większą magię. Tak czy inaczej możesz ten pliczek zakosic ;)
  • Odpowiedz