Wpis z mikrobloga

Skopiuj link

06.07.2015, 16:53:46

Może ktoś dać jakieś wskazówki jak najłatwiej wyciągnąć dane ze swojej strony?

Najlepiej jakby dało się to zrobić z bibliotek #qt (używam #cpp) Teoretycznie zrobiłem wszystko z wykorzystaniem
i
i działało świtnie, później skompilowałem to i przerzuciłem do folderu i... nagle trzeba dorzucić jakieś 10 dllek za wykorzystanie 2 funkcji, trochę nie fajnie, dlatego może zna ktoś jakiś sposób żeby to zrobić lepiej?

Strona wygląda tak:
Mors
Tekst
I chciałbym jedynie pobrać te dwa wyrazy "Mors" i "Tekst". Czytałem trochę o tym curl jednak może jest coś lepszego.
Próbowałem też z jednak wciąż ten plik trzeba jakoś pobrać a te dodatkowe dllki ważą sporo, samo QtWebKit5.dll ma coś ponad 30 MB. :/
Z góry dzięki za odpowiedzi.

c.....l

konto usunięte 06.07.2015, 17:02:01

@morsisko: ja bym szukał jakiegoś parsera/biblioteki/whatever, która generuje obiekt DOM. rozumiem, że webkit to za duża kobyła?

BTW, nie idź w parsery XML. Mało stron jest napisamych w poprawnym XMLu. Więc parser po prostu się wywali, na pierwszym lepszym źle domkniętym tagu.

pp555

06.07.2015, 17:19:33

Próbowałem też z jednak wciąż ten plik trzeba jakoś pobrać a te dodatkowe dllki ważą sporo

@morsisko: Do pobierania możesz użyć klasy QNetworkAccessManager z QtNetwork (dll waży około 1MB).
Nie wiem co z parsowaniem źródła, bo QtXml tak jak wspomniał @cebulak_pl może rzucać błędami przy stronach, które nie są poprawnym XML-em

jeśli używasz Qt5 i zależy ci na małym rozmiarze dllek, to rozważ przekompilowanie Qt bez ICU: Building Qt

Angsoc

06.07.2015, 18:15:48

@morsisko: do tego co napisał @pp555 o QNetworkAccessManager dodaj przetwrzanie zwykłego stringa i będzie dobrze działać

morsisko

06.07.2015, 20:53:37

@pp555: @Angsoc: @cebulak_pl
Ok dzięki, strona jest moja więc sam będę mógł coś naprawić. Jutro postaram się zobaczyć to QNetworkAccessManager

co do @pp555
To znalazłem stronkę z której można pobrać okrojone icu, które zajmuje bardzo mało. :P

Jeszcze dodam że sam ten webkit działa bardzo fajnie, ale aplikacja jest dość mała a ta jedna dllka zajmuje 30MB a trzeba dodać jeszcze kilka, więc słabo to widzę.

c.....l

konto usunięte 06.07.2015, 22:46:29

@morsisko: skoro to twoja strona to może w ogóle nie używaj parserów, tylko pobierz curlem i wyciągnij te tagi wyrażeniem regularnym. Dla ułatwienia możesz je opakować w htmlowy komentarz. #!$%@? ale stabilnie.

A jeśli szukasz lepszego rozwiązania to może zamiast parsować dokument lepiej dobijać się pod jakiś url z jakimś parametrem gdzie wystawisz sobie dane w dogodnym formacie: json, xml, czy co tam wolisz.

c.....l - @morsisko: skoro to twoja strona to może w ogóle nie używaj parserów, tylko... — **źródło:** comment_1gkLqceWUh96zTvaZhSQv0pVj0UDIk4o.gif
Pobierz

Aktywne Wpisy

Kantar

Kantar +72

3 godz. i 58 min temu

Mi się podoba zawieszenie babiarza.

Wiadomo że ci głupsi będą coś o tym sapać (zabierajo wolność xDddd) ale jak babairz ma ochotę na dodawanie takich uwag jak wujas przy weselu to niech to robi prywatnie przed telewizorem a nie za państwowe pieniądze.

W normalny kraju pewnie dostałby jeszcze karę pieniężną
#paryz2024

GeDox

GeDox +1539

4 godz. i 59 min temu

Co dzień będę wrzucał tego posta. Dopóki nie zostanie przewieziony do polskiego aresztu.

Sebastian Majtczak urodzony 31.05.1991 w Bonn, zamieszkały w Łodzi, prowadzący spółkę Rigello Sp. z o.o. jest poszukiwany czerwoną notą Interpolu.

#majtczak #sebastianmajtczak #codziennymajtczak

Wołam: @zarty-na-bok

GeDox - Co dzień będę wrzucał tego posta. Dopóki nie zostanie przewieziony do polskie... — **źródło:** 004fcd0b86a1771101f2c4de16a1d827dabc40a6f15bf2520c0e7a20e273be10
Pobierz

Aktywne Wpisy

Aktywne Znaleziska

Zwolennicy Putina i jego polityki mieszkający w Niemczech. Putinversteher

Uwaga, słonecznikary pustoszą uprawy! Moda na sesje zdjęciowe i jej konsekwencje

Gdynia - Atak nożownika w Kauflandzie na Morskiej

STANOWSKI O ZAWIESZENIU BABIARZA, CHĘĆ O OTWARCIU IGRZYSK

TVP się kaja, bo Babiarz nazwał rzeczy po imieniu

Popularne tagi