Wpis z mikrobloga

siema elo #python i #programowanie (chyba nie zabijecie za ten tag, nie?)
robilem sobie tutoriala na udacity, jakieś pisanie web crawlera i inne takie, no ale chciałem samemu coś spróbować to odpuściłem sobie tutka w połowie jakoś i postanowiłem napisać to samemu.
No ale jakoś po 460 pętlach mi się wsio zawiesza, w zależności od strony. Domyślam się że program trafia na jakiegoś urla którego nie umie ogarnąć czy coś, ale ciężko mi to przeanalizować samemu, dopiero zaczynam.
Zerknie ktoś na kod i mnie naprowadzi plus minus o co chodzi?
http://codepad.org/UyoKvzC8
dodałem komentarze prawie każdej linijki łamanym angielskim więc powinno być łatwiej
btw jak ktoś sie chce #!$%@?ć do składni i innych takich to zapraszam bo w sumie nie wiem jakie są zwyczaje w nazywaniu rzeczy itd.
  • 8
  • Odpowiedz
@3Vw7GkZLSZ46OrVi: request.get(url, allowredirects=True, verify=False), verify=0 "usuwa" problem z SSL, czasami jak strona wymusza bezpieczne połączenie, to zwróci nagłówek 302 i przekieruje z http://o2.pl na https://o2.pl - do tego używaj allowredirects.
Czasami wyskoczy Ci informacja o braku certa, więc strzelasz:

from requests.packages.urllib3.exceptions import InsecureRequestWarning

requests.packages.urllib3.disable_warnings(InsecureRequestWarning)
  • Odpowiedz