Wpis z mikrobloga

Skopiuj link

konto usunięte 23.08.2017, 09:30:05

Wrzuciłem na wykop opis jak przerabiać skany dokumentów na wersje z tekstem (OCR). Zastanawiam się czy nie przygotować maszyny z Linux do obróbki pdf, która byłaby darmową alternatywą dla Abby Finereader i ją Wam udostępnić do testów. Sam taką maszynę używam w firmie i księgowe teraz mają wszystkie skany i pliki z których sobie kopiują informacje takie jak adresy, nipy, numery kont, pozycje faktur.

Plan byłby taki - opis + film na YT
- udostępniam plik vm i opis jak sobie ją zintegrować z systemem
- pokazać jak udostępnić przydziały sieciowe gdzie miały by się znajdować PDFy
- wykonanie skryptu z znaleziska link do znaleziska
- praktyczne wykorzystanie poleceń: pdfgrep, pdftk
- modyfikacje pdf w gui np. pdfmod

ot taki gest dla społeczeństwa i przy okazji pokazanie korzyści prac społeczeństwa open source.

#linux #ocr #ubuntu #debian #wirtualizacja #komputery

swango

23.08.2017, 13:37:52

@time0ut: Dzięki za sprawdzenie. Co to za pakiet "upaper" o którym wspomniałeś? Nie mogę nic znaleźć w google.

t.....t

konto usunięte 23.08.2017, 13:50:55

@swango:
przepraszam za literówke, powinno być unpaper
manual linux http://manpages.ubuntu.com/manpages/trusty/man1/unpaper.1.html
szerszy opis https://github.com/Flameeyes/unpaper/blob/master/doc/basic-concepts.md

wodzik

23.08.2017, 14:04:18

@time0ut: A nie lepiej serwer typu SAAS? X pdfów za free, za kolejne zapłać. Tak tylko pytam ;)

t.....t

konto usunięte 23.08.2017, 14:11:15

@wodzik: Firmy wtedy zastanawiają się nad bezpieczeństwem danych. Samo wysłanie danych na zewnętrzny serwer jest niebezpieczne i powoduje wątpliwości. Mając za darmo bez limitów na każdą metę się bardziej opłaci :)

t.....t

konto usunięte 23.08.2017, 14:24:34

@wodzik: w gruncie rzeczy to moje rozwiązanie to właśnie taki SAAS, wrzucasz pliki PDF do folderu i odbierasz przetworzone, niczym się to nie różni bo wystarczy dopisać jakiś skrypt PHP, doinstalować apache i jest dokładnie to samo :)

t.....t

konto usunięte 23.08.2017, 16:22:04

maszyna przygotowana, teraz zrobic opis. Działania skryptu jako serwer OCR w sieci
https://youtu.be/9sTH_-pdUa4

steam_fisher121

05.09.2017, 11:48:18

@time0ut: wrzucisz gdzieś gotowa maszynę czy za małe zainteresowanie jednak?

t.....t

konto usunięte 05.09.2017, 12:13:52

@steam_fisher121: Jasne! tylko temat mnie tak pochłonął, że ją bardzo rozbudowałem i planuje przygotować stronę z opisem i podpowiedziami jak sobie radzić z plikami z dużą ilością grafiki i ustaleniem orientacji dokumentów. Tym bardziej, że różnica pomiędzy tesseract 3.04 a 4.00 jest bardzo duża różnica. W przyszłym tygodniu opublikuje wynik na stronie i zrobię znalezisko.

matsto15

20.09.2017, 23:39:35

Komentarz usunięty przez autora

ploekilas

25.10.2017, 07:42:14

@time0ut: Można gdzieś pobrać tą wirtualkę? Odezwij się proszę, albo odblokuj pw. Dzięki.

Aktywne Wpisy

cuks

cuks +3

45 min temu

Jakiś czas temu umówiłam się na pierwszą randkę z tindera z facetem, którym byłam oczarowana, zauroczona wręcz, byłam tak zestresowana na spotkaniu, że zabrakło mi śliny w gardle, po jakichś 20 minutach typ złapał mnie za rękę jakbyśmy byli małżeństwem z dziesięcioletnim stażem, później z uśmiechem chwycił mnie za nogę i zażartował żebym się rozluźniła, zamurowało mnie, wyszłam z baru w którym się umówiliśmy z pretekstem, że źle się czuję, płakałam całą

Pink_Floyd

Pink_Floyd +2

1 godz. i 14 min temu

#alkohol #alkoholizm #zdrowie #kiciochpyta

Może głupie pytanie, ale jaki sens ma nocny zakaz sprzedaży alkoholu np. po 22?

Kto ma się #!$%@?ć do 22 już się #!$%@?, jeżeli zrobi to porządnie to trzyma go dobre kilka godzin, więc nocne hałasy, oszczane bramy kamienic i inne tego typu "atrakcje" i tak i tak będą.

Nie ma chyba ludzi, którzy o 22:15 wpadają na pomysł "idźmy,

Aktywne Wpisy

Aktywne Znaleziska

Jakie są efekty wizyty Zełenskiego w PL ? Prezydent Ukrainy milczał ws. Wołynia

Europejski street food, w indyjskim stylu

Haaretz: Wojsko Izraela zabijało własnych cywilów i żołnierzy (nie tylko Hamas)

Machcewicz: Jako społeczeństwo musimy się zmierzyć z historią mordowania Żydów

Skandaliczny list poparcia! Holland, Engelking, Gross za usunięciem bohaterów

Popularne tagi