Aktywne Wpisy
![Wiskoler_double](https://wykop.pl/cdn/c3397992/Wiskoler_double_VpRmgHLrTQ,q60.jpg)
Wiskoler_double +18
#szczecin
Szczecin ładny jest, trzeba tylko poszukać. Zdjęcie zrobione aparatem Fed 5 C, czarnobiałej fotografii czar.
Szczecin ładny jest, trzeba tylko poszukać. Zdjęcie zrobione aparatem Fed 5 C, czarnobiałej fotografii czar.
![Wiskoler_double - #szczecin
Szczecin ładny jest, trzeba tylko poszukać. Zdjęcie zrob...](https://wykop.pl/cdn/c3201142/b711c78dca2e307ea435896962f75430c9b52c1b36520e5a44cd9651cf79daf1,w150.jpg)
źródło: 04 - Fied 5 c
Pobierz![TrisssMerigold](https://wykop.pl/cdn/c0834752/61ca7e8d31c2b7137e97800a6317fff8022171f81f001da24eeb024f26085664,q60.jpg)
TrisssMerigold +112
![TrisssMerigold - Śmieciarka już się zbliża, już puka do mych drzwi #heheszki #gownowp...](https://wykop.pl/cdn/c3201142/2f7df7483ae111cbeda0fcb35ea683bbd981c0986fc9b7d6827b0f543b521e72,w150.jpg)
źródło: temp_file9177121253834601157
Pobierz
Przykładowo, taki crawler wchodziłby na www.wykop.pl i wyciągał tytuł wpisu, autora, a następnie wchodził do danego wpisu i wyciągał najbardziej punktowaną odpowiedź (czyli parsowanie www.wykop.pl oraz znalezionych URL).
Kojarzy ktoś coś w tym kierunku, albo może polecić? Albo są już gotowe narzędzia, które da się jakoś sparametryzować?
Zasadniczo to byłoby coś jakby AdBlock/uBlock tylko działające w drugą stronę - nie blokujące części strony, tylko zapisujące gdzieś te części na dysku a ignorujące resztę.
#programowanie #naukaprogramowania #javascript #python #php #webdev #webstuff sorry jeżeli któryś tag użyłem nieprawidłowo
Komentarz usunięty przez autora
Ja pisałem w pythonie z simplehttpparser.
A masz to swoje jeszcze, ewentualnie możesz udostępnić?