Wpis z mikrobloga

Skopiuj link

26.04.2021, 10:41:12

Hejka mirki mam pytanko #programowanie

Mam bota co zbiera sobie pewne informacje z różnych stron i w tym celu raz dziennie wysyła zapytanie i dzisiaj jedna strona zamiast zwrócić mi interesujące mnie dane daje mi #captcha. Pytanko jak to ominąć, ponieważ wchodząc na stronę z poziomu przeglądarki wszystko działa, więc jakaś blokada na ip odpada a zapytanie do strony wysłam ze swoim user-agent (taki sam jak tej przeglądarki co na niej działa). Co muszę ustawić w wysyłanym zapytaniu aby wyświetlała mi się strona jak dla zwykłego użytkownika? Używam biblioteki #requests w #python, troche #webdev

LazyInitializationException

26.04.2021, 10:46:20

Komentarz usunięty przez moderatora

blackredwhite

26.04.2021, 10:46:37

@h00k: sprwadź cookies'y, captchuer może pod js'm sprawdzać rozdzielczość system itd. stąd może to być nie do ominięcia

GaiusBaltar

26.04.2021, 10:47:39

@h00k: Udawanie przeglądarki to ciężka sprawa, jeśli strona się aktywnie przed tym zabezpiecza. Lepiej odpalić jakieś narzędzie wewnątrz prawdziwej przeglądarki do symulowania tego co robił użytkownik, i wyciągać tak dane. Wieki temu coś dokładnie takiego robiłem skryptami greasemonkey i selenium, ale teraz pewnie są milion razy lepsze narzędzia.

nightman

26.04.2021, 11:02:43

@h00k: Jest dużo zabezpieczeń antybotowych, Jeśli strona jest za Cloudflare to mogłeś wpaść w filtr antyspamowy/antybotowy (np. za częste requesty po sobie, dziwny user agent, rozdziałka itd).

Możesz spróbowac za pomocą np. Puppeteer (headless Chrome) ale i tak jak wpadniesz na listę to nie przeskoczysz łatwo nawet zmieniając IP.

Kiedyś dużo stron udostepniało treści jako RSS/aAtom i można było łatwo sprawdzać aktualizację. Możesz wpisać adres np. w Feedly i sprawdzić co

SzatanDiabel

26.04.2021, 17:08:04

@h00k: Można też rozwiązać captche np. 2captcha.com

Aktywne Wpisy

MiniKierownik

MiniKierownik +49

3 godz. i 49 min temu

Murzyn rośnie jak na drożdżach, możecie mu wymyślić imię, komentarz z największą liczbą plusów wygrywa. Widać że to będzie chad wśród gołębi, gęste grube pióra będzie miał nawet na nogach, oczy typu Hunter eye wypatrują kukurydzy.

#smiesznypiesek #ptaki #heheszki #codziennymurzyn #golebie #dwudniowymurzyn

MiniKierownik - Murzyn rośnie jak na drożdżach, możecie mu wymyślić imię, komentarz z... — **źródło:** temp_file508722841007941077
Pobierz

zyd_z_pasji

zyd_z_pasji +30

5 godz. i 16 min temu

Jezus Maria, jak ja qurwa nienawidzę dzieci. Gówniarze sąsiadów lvl 4 i 6 przeskakują przez płot, żeby pobawić się u nas na podwórku. Tu sobie poskaczą na trampolinie, tam zjadą na zjeżdżalni albo rozwalą dachówki, które były ułożone na kupce do wyrzucenia. Oczywiście, rozmowy z madkom nic nie dają, a jedyne rozwiązanie to chyba tylko mur wyższy od mego, albo drut kolczasty.

Teraz wychodzę przez dom, a tu mój samochód cały w

Aktywne Wpisy

Aktywne Znaleziska

Sztuczna inteligencja ma rasistowskie zapędy. Naukowcy i twórcy próbują to napra

Porównanie prędkości obrotu wokół własnej osi planet Układu Słonecznego

Dlaczego neutrony umierają młodo, a protony są wieczne?

Krótka historia o tym, jak management Boeinga zniszczył własną firmę

Ukraińcy mówią wprost. To dlatego nie chcą iść na wojnę

Popularne tagi