@hocuspocus: jak wykonujesz w tesseracie image to text: text = tesserocr.imagetotext(image, lang='pol', path="/usr/share/tesseract-ocr/") i jest po polsku to polecam zmienic jezyk, jak wyżej ^ a potem najlepiej jeszcze przepuścić jakimś regexem - bo czasami wpisuje jakies underscorry czy inne gowna text = re.sub('[^A-Za-z0-9.,:?]', ' ', text)
a i chyba najlepiej dodaj wyostrzenie + czarno bialy tekst bo chyba tak najlepiej działało
@Init0: dzięki, dałem plusa ale wyskakuje ze jakiś limit niby osiągnąłem ....
a żeby przygotować sobie obrazek to scikit ale ja uzywalem cv2
text = tesserocr.imagetotext(image, lang='pol', path="/usr/share/tesseract-ocr/")
i jest po polsku to polecam zmienic jezyk, jak wyżej ^
a potem najlepiej jeszcze przepuścić jakimś regexem - bo czasami wpisuje jakies underscorry czy inne gowna
text = re.sub('[^A-Za-z0-9.,:?]', ' ', text)
a i chyba najlepiej dodaj wyostrzenie + czarno bialy tekst bo chyba tak najlepiej działało
@Pmpa: widzę, potężny silnik :)