Wpis z mikrobloga

Znacie jakiś program cli #linux albo np. bibliotekę np. #python które by umożliwiły łatwe odczytywanie bardzo prostej captchy? (Pic rel)

szukałem gotowców ale nic za bardzo nie działało, tesseract też nie daje sobie rady
assninja - Znacie jakiś program cli #linux  albo np. bibliotekę np. #python które by ...

źródło: captcha

Pobierz
  • 12
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@assninja: ogólnie nie mam doświadczenia z captchami, ale to co ja bym zrobił to spróbował to preprocesować np przez imagemagic tzn. określił kolor tła i rozszerzył kolor np o dwa piksele. Przykład na screenie. Zobacz czy to ci tesseract łapie
Kryspin013 - @assninja: ogólnie nie mam doświadczenia z captchami, ale to co ja bym z...

źródło: Untitled

Pobierz
  • Odpowiedz
  • 0
@Kryspin013: o ale jak ustawisz "język" na snum albo osd to całkiem nieźle

tesseract -l snum --psm 12 Downloads/captcha2.png - nobatch digits

Estimating resolution as 525
Too few characters. Skipping this page
OSD: Weak margin (0.00) for 3 blob text block, but using orientation anyway: 0
94 0335
  • Odpowiedz
  • 0
ale ogólnie to tesseract raczej nie zadziała dobrze xd

> for i in *.png; do echo "$i : $(tesseract -l snum --psm 13 $i - nobatch digits 2>/dev/null | tr -dc '[0-9]')"; done


026529.png : 0267619335
  • Odpowiedz
magick Downloads/captcha.png -threshold 65% captcha.png


@assninja: sam treshold to za mało. To co ci podesłałem wyżej jako przykłady to na pałę w gimpie zrobiłem bo nie chciało mi się znowu robić docroratu z imagemagic, ale, w imagemagic robiłem kiedyś takie rzeczy by usuwac syf z obrazu, więc zanim zrobisz treshold ja bym się starał preprocesowac obrazy by pozbyć się plamek i niepotrzebnych linii i wtedy puścić test dla większej ilości
  • Odpowiedz
@assninja: Raczej mało przydatne, ale JDownloader ma różne captcha solvery za darmo. Raczej do słabszych rozwiązań. Ale to w Javie i musiałbyś jakoś wymuskać pewnie kod
  • Odpowiedz