#pdf #ocr #informatyka Koledzy, dopomóżcie, nakierujcie. Czy znacie darmowy (lub w ostateczności nie) program, który by umożliwiał edycję warstwy z OCR? Czyli aby mając dokument pdf z OCR, widząc błąd - móc ten błąd poprawić i zapisać zmianę. Najlepsza opcja jest w Abbyy Finerederze, gdzie w jednym oknie mamy oryginał a w drugim tekst, ale szukam czegoś szybszego/prostszego/chętnie darmowego.
  • 2
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@Edd3201: nie wiem czy znalazles juz czy nie bo troche minelo :P
Ale co ja bym polecił to obczajenie na fejsi/ insta/ twitterze itd kilku takich zapalonych ninja w Polske (np ten Bandosz, Ninja witcher, i kilku innych z tej topki jakich widac na ninja warrior) i oni czesto wrzucają na relacje ze beda gdzies brac udział albo ze polecają jakies zawody. Mysle ze przez ich profile mozesz poznac ten
  • Odpowiedz
Da się jakoś prosto (narzędzie online albo program) zrobić ocr na pdfie w którym są tylko obrazki z tekstem, tak żeby dało się w nim wyszukiwać tekst? #pdf #dokumenty #ocr #komputery
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

jak przekształcić kilka plików naraz w ocr? jest jakaś strona na to? Bo póki co robię pojedyńczo, ale to za dużo czasu zajmuje
#komputery #ocr
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Ma ktoś jakiś fajny soft opierający sie na #ocr do automatyzacji tłumaczenia mang?
Sprawdzałem kilka sposobów ale nie do końca działa to jak należy.
#manga
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

W sensie co konkretnie chcesz osiągnąć? Chcesz sczytać kanji do wersji tekstowej?

Czy chcesz angielskie tłumaczenia tłumaczyć?
Bo jak to drugie to daj sobie spokój z tłumaczeniem, gdyż tłumaczenia tłumaczeń to poroniony pomysł.

No chyba, że chcesz maszynowe tłumaczenia z Google translate to już w ogóle pytań nie mam ;)
  • Odpowiedz
#python #scraping #ocr

Czy jest możliwe dokładne pobieranie danych z pdfu, który wygląda jak np. gazetka Biedronki?
Potrzebuję zebrać sporo danych historycznych i m.in. takie pdfy są znakomitym źródłem informacji jednak próbowałem różnych programów ocr i efekt jest słaby. Z kolei ręczne wklepywanie kilkuset pdf też wygląda słabo.

Znacie jakieś programy ocr, sposoby jak to zrobić?
  • 3
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@mk321: ogólnie nic z tego nie wyszło :) Udało nam się zebrać dane na temat wystawcy dokumentu, nabywcy, dane faktury jak data i numer, ale analiza tabel nas niestety rozłożyła. Nie wiadomo, kiedy jaka kolumna się zaczyna, ile jest wierszy ( np. jeden wiersz może mieć nazwę towaru na kilka linii, bądź zaraz pod tabelą może być podsumowanie, albo cyfry na fakturze zapisywane w formacie "1 005 " co już
  • Odpowiedz
Tldr: jak analizować tekst otrzymany z Google.vision.Api.
Mam cel zrobic aplikacje w której użytkownik będzie mógł zrobic zdjęcie wyniku badania (papierowego), zdjęcie wysyłane było by do chmuury w celu rozpoznawania tekstu a następnie zapisywało by dane z tego wyniku w bazie. Problem mam po otrzymaniu tekstu z chmury, w jaki sposób rozpoznać co jest czym. Np. Najczęściej w nagłówku mam dane laboratorium wykonującego wynik, jednak jest on zapisywany różnie zależnie od laboratorium
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

via Wykop Mobilny (Android)
  • 0
@DaxterPoker: jak dla mnie to zrobiłybym sobie nową strukturę z danymi uporządkowanymi przez Ciebie, takie, które każdy wynik badań ma. Potem przejście jakimś pattern matcherem po tej tabeli z danyni z OCR i zapisywać je w odpowiednim miejscu w Twojej strukturze. Pewnie jest coś co robi to w locie, ale nie znam nic takiego ( ͡° ʖ̯ ͡°)
  • Odpowiedz