Wpis z mikrobloga

Skopiuj link

04.09.2020, 11:44:07

0

Mireczki #programowanie , polecicie mi jakieś repo wspierające #ocr dla #python ?

04.09.2020, 12:05:04

2

@hocuspocus: python tesseract

04.09.2020, 12:30:00

0

python tesseract

@Init0: dzięki, dałem plusa ale wyskakuje ze jakiś limit niby osiągnąłem ....

04.09.2020, 12:31:37

1

@hocuspocus: spoko ¯\_(ツ)_/¯
a żeby przygotować sobie obrazek to scikit ale ja uzywalem cv2

hocuspocus

04.09.2020, 12:36:50

0

@Init0: Już ogarnięty mam skrypcik :)

04.09.2020, 12:40:25

2

@hocuspocus: jak wykonujesz w tesseracie image to text:
text = tesserocr.imagetotext(image, lang='pol', path="/usr/share/tesseract-ocr/")
i jest po polsku to polecam zmienic jezyk, jak wyżej ^
a potem najlepiej jeszcze przepuścić jakimś regexem - bo czasami wpisuje jakies underscorry czy inne gowna
text = re.sub('[^A-Za-z0-9.,:?]', ' ', text)

a i chyba najlepiej dodaj wyostrzenie + czarno bialy tekst bo chyba tak najlepiej działało

06.09.2020, 13:33:42

1

@hocuspocus: easyocr

hocuspocus

06.09.2020, 13:42:44

0

easyocr

@Pmpa: widzę, potężny silnik :)