Masochizm w czystej postaci... Muszę wyciągnąć link i linki obrazków ze źródła strony. "OCZYWIŚCIE", bez użycia biblioteki, która parsuje html... Żeby sobie poćwiczyć "latanie wskaźnikami po tekście".
Dobra ale dość narzekania. Mam kilka pomysłów, ale za nim zacznę to pisać chciałbym zapytać czy Wy mirki macie jakieś ciekawe pomysły jak to ładnie zaimplementować. Bez zbyt dużego syfu :|
Myślałem żeby to oprzeć na wyrażeniach regularnych, bo to mi nawet mogłoby się przydać w dalszej części. Ale nie wiem...
Ps. Sorry, jeżeli pytam o głupotę, ale muszę to ogarnąć w miarę szybko.
potem w tych znacznikach szukasz "słówko" href=, kopiowanie adresu, który się znajduje się po "href", potem pobieranie tego pliku podstrony i jej przeszukiwanie itd., obrazki szukasz podobnie, znacznik "img".
Ogólnie możesz poszukać jak się pisze Crawler'y, one przeszukują
@Hauleth: @panati: No to tak jak myślałem, idę w regexp. Zobaczymy jak to w C działa, bo z tego co widzę to sam język nie ma zaimplementowanych regexów. Ale co tam, najwyżej się przyczepi typek do tego.
Masochizm w czystej postaci... Muszę wyciągnąć link i linki obrazków ze źródła strony. "OCZYWIŚCIE", bez użycia biblioteki, która parsuje html... Żeby sobie poćwiczyć "latanie wskaźnikami po tekście".
Dobra ale dość narzekania. Mam kilka pomysłów, ale za nim zacznę to pisać chciałbym zapytać czy Wy mirki macie jakieś ciekawe pomysły jak to ładnie zaimplementować. Bez zbyt dużego syfu :|
Myślałem żeby to oprzeć na wyrażeniach regularnych, bo to mi nawet mogłoby się przydać w dalszej części. Ale nie wiem...
Ps. Sorry, jeżeli pytam o głupotę, ale muszę to ogarnąć w miarę szybko.
Możesz po prostu ściągnąć plik .index.htm(l), potem przeszukiwać go regexem, w c# wyszukiwałam najpierw znaczniki ..,
MatchCollection m1 = Regex.Matches(htmlText, @"(.*?)", RegexOptions.IgnoreCase | RegexOptions.Singleline); //szukamy znacznikow
potem w tych znacznikach szukasz "słówko" href=, kopiowanie adresu, który się znajduje się po "href", potem pobieranie tego pliku podstrony i jej przeszukiwanie itd., obrazki szukasz podobnie, znacznik "img".
Ogólnie możesz poszukać jak się pisze Crawler'y, one przeszukują
generalnie lecisz w pętli i sprawdzasz kolejne znaki (musisz natrafić na ".
z img podobnie. zwykły algorytm wyszukujący frazę w tekście.