Wykop.pl Wykop.pl
  • Główna
  • Wykopalisko216
  • Mikroblog
  • Zaloguj się
  • Zarejestruj się
  • Wykop.pl
  • Ciekawostki

    Ciekawostki
  • Rozrywka

    Rozrywka
  • Sport

    Sport
  • Motoryzacja

    Motoryzacja
  • Technologia

    Technologia
  • Informacje

    Informacje
  • Gospodarka

    Gospodarka
  • Podróże

    Podróże

Dostosuj Wykop do siebie

Wybierz treści, które Cię interesują
i zapisz jako Własną kategorię.

0

Web Scraper PHP CURL SEO Google recaptcha

Web Scraper PHP CURL SEO Google recaptcha

Ostatnio sprawdziłem dlaczego wujek Google blokuj antybot (status 302 => 503) mojego Web Scrapera :) i o dziwo php CURL jak daje na HTTP 1.1 wyskakuje recaptcha a na HTTP 2.0 nie :) więc może warto skompilować sobie PHP z nowym CURL na serwerze :) Większość ma jakieś skrobaki pozycji SEO i...

jokerracer
jokerracer
z
wykop.pl
dodany: 22.01.2019, 02:29:01
  • #
    polska
  • #
    seo
  • #
    python
  • #
    php
  • #
    jokerracer
  • #
    programowanie
  • 2
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Ostatnio sprawdziłem dlaczego wujek Google blokuj antybot (status 302 => 503) mojego Web Scrapera :) i o dziwo php CURL jak daje na HTTP 1.1 wyskakuje recaptcha a na HTTP 2.0 nie :) więc może warto skompilować sobie PHP z nowym CURL na serwerze :)


Większość ma jakieś skrobaki pozycji SEO i nawet chyba o tym nie wie albo wie i nic tu nie kopią na wykopie hihi (szkoda marnować proxy wiadomo, że większość botów daje na CURLOPT_HTTP_VERSION  1.1)


CURLOPT_HTTP_VERSION 

CURL_HTTP_VERSION_2

curl 7.47.0


Takie coś to OK :

curl -I https://www.wykop.pl
HTTP/2 200
date: Tue, 12 Jan 2019 02:10:28 GMT
content-type: text/html; charset=UTF-8
vary: Accept-Encoding
h1: wykop-03
expires: Thu, 19 Nov 1981 08:52:00 GMT
cache-control: no-store, no-cache, must-revalidate
pragma: no-cache
set-cookie: WSSID=...; path=/; domain=.wykop.pl; HttpOnly
x-utime: 0
x-be: www-dynamic-nginx/wykop-03
gw-server: greywizard-1.9
server: greywizard-1.9
set-cookie: JSESSIONIDN=s-03; path=/; domain=.wykop.pl
set-cookie: grey_wizard=...
x-xss-protection: 1; mode=block

A takie nie :

# Unsupported protocol error





Pozdrowienia dla pozycjonerów z Polski i Rosji ;)

Komentarze (2)

najlepsze

jokerracer
jokerracer
Autor
24.01.2019, 16:25:08
  • 0
większość osób ma jakieś api i płaci krocie za odczyt pozycji jak można za free
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

H.....s
H.....s
konto usunięte 22.01.2019, 22:53:55 via Android
  • 0
Cóż, kto by się spodziewał po nich ))¯_(ツ)_/¯
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych odpowiedziach

Hity

tygodnia

Policja: Sebastian Majtczak zatrzymany! Teraz deportacja do Polski!
Policja: Sebastian Majtczak zatrzymany! Teraz deportacja do Polski!
5908
[An Amazing Wizard] Właśnie wydałem swoją grę na Steamie! Chcę rozdać Wam klucze
[An Amazing Wizard] Właśnie wydałem swoją grę na Steamie! Chcę rozdać Wam klucze
4223
Majtczak z konwojem w Polsce. Mamy zdjęcia z lotniska
Majtczak z konwojem w Polsce. Mamy zdjęcia z lotniska
4031
Gdyby nie internet, Sebastian M. nadal spacerowałby po Dubaju
Gdyby nie internet, Sebastian M. nadal spacerowałby po Dubaju
2356
Eurowizja 2026 bez Izraela? Tego chce zwycięzca tegorocznego konkursu
Eurowizja 2026 bez Izraela? Tego chce zwycięzca tegorocznego konkursu
1819
Pokaż więcej

Powiązane tagi

  • #wydarzenia
  • #ciekawostki
  • #europa
  • #prawo
  • #ekonomia
  • #gospodarka
  • #4konserwy
  • #swiat
  • #heheszki
  • #historia
  • #policja
  • #usa
  • #warszawa
  • #neuropa
  • #niemcy

Wykop © 2005-2025

  • Nowy Wykop
  • O nas
  • Reklama
  • FAQ
  • Kontakt
  • Regulamin
  • Polityka prywatności i cookies
  • Hity
  • Ranking
  • Osiągnięcia
  • Changelog
  • więcej

RSS

  • Wykopane
  • Wykopalisko
  • Komentowane
  • Ustawienia prywatności

Wykop.pl