Wpis z mikrobloga

@hocuspocus: jak wykonujesz w tesseracie image to text:
text = tesserocr.imagetotext(image, lang='pol', path="/usr/share/tesseract-ocr/")
i jest po polsku to polecam zmienic jezyk, jak wyżej ^
a potem najlepiej jeszcze przepuścić jakimś regexem - bo czasami wpisuje jakies underscorry czy inne gowna
text = re.sub('[^A-Za-z0-9.,:?]', ' ', text)

a i chyba najlepiej dodaj wyostrzenie + czarno bialy tekst bo chyba tak najlepiej działało