Wpis z mikrobloga

Może ktoś dać jakieś wskazówki jak najłatwiej wyciągnąć dane ze swojej strony?

Najlepiej jakby dało się to zrobić z bibliotek #qt (używam #cpp) Teoretycznie zrobiłem wszystko z wykorzystaniem
i
i działało świtnie, później skompilowałem to i przerzuciłem do folderu i... nagle trzeba dorzucić jakieś 10 dllek za wykorzystanie 2 funkcji, trochę nie fajnie, dlatego może zna ktoś jakiś sposób żeby to zrobić lepiej?

Strona wygląda tak:
Mors
Tekst
I chciałbym jedynie pobrać te dwa wyrazy "Mors" i "Tekst". Czytałem trochę o tym curl jednak może jest coś lepszego.
Próbowałem też z jednak wciąż ten plik trzeba jakoś pobrać a te dodatkowe dllki ważą sporo, samo QtWebKit5.dll ma coś ponad 30 MB. :/
Z góry dzięki za odpowiedzi.
  • 5
@morsisko: ja bym szukał jakiegoś parsera/biblioteki/whatever, która generuje obiekt DOM. rozumiem, że webkit to za duża kobyła?

BTW, nie idź w parsery XML. Mało stron jest napisamych w poprawnym XMLu. Więc parser po prostu się wywali, na pierwszym lepszym źle domkniętym tagu.
Próbowałem też z jednak wciąż ten plik trzeba jakoś pobrać a te dodatkowe dllki ważą sporo


@morsisko: Do pobierania możesz użyć klasy QNetworkAccessManager z QtNetwork (dll waży około 1MB).
Nie wiem co z parsowaniem źródła, bo QtXml tak jak wspomniał @cebulak_pl może rzucać błędami przy stronach, które nie są poprawnym XML-em

jeśli używasz Qt5 i zależy ci na małym rozmiarze dllek, to rozważ przekompilowanie Qt bez ICU: Building Qt 5 from
@pp555: @Angsoc: @cebulak_pl
Ok dzięki, strona jest moja więc sam będę mógł coś naprawić. Jutro postaram się zobaczyć to QNetworkAccessManager

co do @pp555
To znalazłem stronkę z której można pobrać okrojone icu, które zajmuje bardzo mało. :P

Jeszcze dodam że sam ten webkit działa bardzo fajnie, ale aplikacja jest dość mała a ta jedna dllka zajmuje 30MB a trzeba dodać jeszcze kilka, więc słabo to widzę. :(
@morsisko: skoro to twoja strona to może w ogóle nie używaj parserów, tylko pobierz curlem i wyciągnij te tagi wyrażeniem regularnym. Dla ułatwienia możesz je opakować w htmlowy komentarz. #!$%@? ale stabilnie.

A jeśli szukasz lepszego rozwiązania to może zamiast parsować dokument lepiej dobijać się pod jakiś url z jakimś parametrem gdzie wystawisz sobie dane w dogodnym formacie: json, xml, czy co tam wolisz.
c.....l - @morsisko: skoro to twoja strona to może w ogóle nie używaj parserów, tylko...

źródło: comment_1gkLqceWUh96zTvaZhSQv0pVj0UDIk4o.gif

Pobierz