
alteron
Znam podstawy podstaw pythona. Chciałbym nauczyć się jak użyć tesseracta (chyba że istnieje jakaś lepsza biblioteka do OCR) do wyciągnięcia tekstu z książek w pdf głównie. W razie jeżeli ten OCR byłby kulawy (zakładam że będzie) w jaki sposób nauczyć program lepszego rozpoznawania tekstu, tabelek. Następnie zastosować jakieś techniki żeby zanalizować ten tekst. Przyznaję że jestem laikiem w programowaniu więc potrzebowałbym jakiś kompleksowy poradnik jak się do tego zabrać. Wiem że nie































