Wpis z mikrobloga

hejo programistyczne świry

kiedy chcę dobrać się np do wpisów na pierwszej stronie gorących to robię

from bs4 import BeautifulSoup

import requests


response = requests.get('https://www.wykop.pl/mikroblog/hot/ostatnie/6/')

soup = BeautifulSoup(response.text, "html.parser")


czy coś w tym stylu prawda

a co jeśli chcę zescroblować np http://www.wykop.pl/naruszenia/moje/ czy ogólnie jakąś stronę wymagającą bycia zalogowanym
jakie jest najlepsze rozwiązanie

#programowanie #python
  • 9
@Chodtok: zrób sesje przez requests.Session() i pierw wykonaj logowanie na wykopie w jednym request, a później w drugim pobierz zawartość strony. Jest też jakieś API dostępne z wykopu, może z niego da się wydobyć to czego potrzebujesz, to byłby najlepsza opcja raczej
@Chodtok: najprościej będzie zastosować tzw. session jar, działa to tak jak nazwa sugeruje masz pewną sesję requests która zapisuje ciasteczka z odpowiedzi serwera / serwerów i używa ich jak przeglądarka. Nie wiem dokładnie jak to działa w pythonie, ale to pytanie z pewnością może pomóc

https://stackoverflow.com/a/6930182/4183352

później za każdym razem gdy zajdzie potrzeba wysyłasz sobie request logujący na wykop i wtedy w odpowiedzi dostajesz ciasteczka autoryzujące które automatycznie masz w "słoiku"