Wpis z mikrobloga

@Radaka: jak już jesteśmy w temacie, to miałbym pytanko - czy można przekierować dane wyjściowe do zmiennej, czy można tylko do pliku? używałem tego w życiu 2-3 krotnie i nie znalazłem takiej opcji.
  • Odpowiedz
@Radaka: Tesseracta używasz do wyciągania samego tekstu czy hOCR (tekst w HTML ze współrzędnymi)?

Wydaje się, że hOCR jest świetny... Ale w praktyce ciężko cokolwiek z niego wyciągnąć i przetwarzać. Kończy się na tym, że wyciągam z hOCR po prostu cały tekst. Tracąc przy tym łamanie linii, które bym miał jakbym wziął z Tesseract bezpośrednio sam tekst.

Bo nie znalazłem opcji, żeby dostać na wyjściu obie wersje: hOCR + tekst
  • Odpowiedz
@Radaka: a jak masz takie przypadki, że chcesz rozpoznać, że jakiś tekst jest w jakimś obszarze strony?

Przykładowo:

- Jakiś tekst jest na górze strony.
a) Mogę zrobić hOCR i sprawdzić współrzędnymi y czy jest
  • Odpowiedz
  • 0
@luukasek niestety windowsa używam sporadycznie tylko do grania , skorzystaj z wsl z na nim zainstaluj sobie wszystko jak byś miał problem z tym na windowsie
  • Odpowiedz