Ogarnia ktoś #postscript ? #programowanie
Wszystko
Najnowsze
Archiwum

tyrytyty
- 1

LM317K
- 2
@tyrytyty: a cóż to za wynalazek?

tyrytyty
- 1
@LM317K:
- 5
Mireczki wiecie może jak wypakować tekst z PDFa, który nie posiada informacji o czcionkach(CMAP) - prawdopodobnie zostało to usunięte z pliku, dla oszczędności pamięci. PDFa można normalnie odczytywać np. w Adobe Reader, natomiast problem pojawia się właśnie przy wypakowywaniu tekst przy użyciu GhostScriptu, pdf2txt czy pdf2ps - nie można tego rozkodować i out wyglada mniej więcej tak:
(cid:51)(cid:58)(cid:3)(cid:44)(cid:57)(cid:3)(cid:16)
(cid:36)(cid:71)(cid:80)(cid:76)(cid:81)(cid:17)
(cid:86)(cid:76)(cid:72)(cid:70)(cid:17)- 1
@Skalpel_: http://www.onlineocr.net obczaj to.
- 1
@biczek: Wykminiłem patent na to. Wykorzystałem do tego biblioteke selenium która odpala mi Firefoxa z pdfem, zaznacza wszystko i kopiuje do schowka. ( ͡º ͜ʖ͡º) W miare szybko działa i nie trzeba captcha przepisywac :E pozdr.

