Wpis z mikrobloga

Skopiuj link

28.03.2019, 23:37:27

Czy 403 Access Denied zależy tylko od IP?

panowie, bo czegoś nie rozumiem...
mam potrzebę scrapowania jednej strony, html pobierany jest co sekunde, co skutkuje blokada na ip po okolo godzinie (serwer odsyła 403)
więc zmodyfikowalem skrypty tak aby leciały przez proxy (ściągam liste 10000 może z 2000 jest działających) więc load się ładnie rozkłada

i tak sobie scrapowałem dane przez dwa tygodnie az do teraz. kazde proxy zwaca 403, glowne ip zwraca 403 (z lokalnego komputera moge sie dostać do url)

jako, że serwerek mam na aws to zrobiłem stop/start dostał nowe ip i nadal 403

co jest? możliwe, że aws mnie przyblokował?

co zrobić aby nadal sobie latał po tym url?

#network #networking #sieci #siecikomputerowe #programowanie #aws

p.....u

konto usunięte 28.03.2019, 23:42:32

@gromwell: a co scrapper ma w headerze? Może to jest kluczem, server sobie sprawdza header i jak ma jakieś podejrzane treści to blokuje i zwraca 403

gromwell

28.03.2019, 23:46:37

@papciu: nie wiem?
używam pythona request get
response = get(url, proxies={'https': ip}, timeout=10)
gdzie ip to adres proxy

p.....u

konto usunięte 28.03.2019, 23:54:10

@gromwell: Nie siędzę w pythonie, ale zakładam, że podobnie jak i w innych językach musisz ustawić header zapytania get, tak aby przypominał wizytę normalnej przeglądarki, a nie ewidentnie bota tak jak pewnie jest teraz.
https://stackoverflow.com/questions/6260457/using-headers-with-the-python-requests-librarys-get-method

jakie headers ustawić? Te powinny wystarczyć:
https://www.whatismybrowser.com/detect/what-http-headers-is-my-browser-sending

gromwell

29.03.2019, 00:16:20

@papciu: dzieki!
jutro sprawdze cos takiego:
https://pypi.org/project/fake-useragent/

gromwell

30.03.2019, 10:52:14

@papciu: wychodzi na to, ze mnie odblokowali ;p
ale dodałem tez tego fake-useragenta, mam nadzieje ze przez to sie nie powtorzy problem
jeszcze raz dzieki

p.....u

konto usunięte 30.03.2019, 12:09:53 via iOS

@gromwell: mielgo gromadzenia danych :p

Aktywne Wpisy

cohh

cohh +75

3 godz. i 10 min temu

Byłem dzisiaj w przychodni i postanowiłem skorzystać z prawa do pierwszeństwa w kolejce ze względu na posiadaną legitymacje honorowego dawcy krwi.

Pani w recepcji powiedziała, że mogę, ale pacjenci różnie reagują i się nie myliła.

Podszedłem pod gabinet lekarza, w kolejce było ~ 20 osób, spytałem się grzecznie kto teraz będzie wchodził i zacząłem wyjaśniać, że mam legitymację, jest takie prawo itd. przede mną była pani ~ 60 lat, powiedziała mi, że tu

Lukaszo5

Lukaszo5 +112

1 godz. i 54 min temu

Dla typowej p0lskiej witaminki, „kanoniczne” wydarzenie, to dać d--y obcokrajowcy xD #p0lka #heheszki