Wpis z mikrobloga

Skopiuj link

03.04.2022, 10:57:17

Piszę swój pierwszy w życiu skrypt do web scrapingu i napotkałem pewien problem. Tak wygląda struktura mojej strony: https://pastebin.com/yPRJtxXu Moim zadaniem jest pobranie wszystkich plików pdf i mat ze strony, niestety nie wiem jak głęboko są one zagnieżdżone. Tutaj mój aktualny kod: https://pastebin.com/wfb6FJ8a Skrypt działa dopóki nie znajduje peirwszego pliku pdf. Problem polega na tym, że jak znajduje pierwszy plik pdf to nie iteruje dalej tylko dokleja do jego ścieżki kolejne hrefy czyli w tym przypadku plik mat i dalej dzieje się to samo dla kolejnych ścieżek, też są posklejane z poprzednimi. Pierwszy raz w życiu robię web scraping i rekurencję, nie wiem czy nie przegiąłem jak na jeden razy :D. Nie jestem w stanie dać linku do strony bo to wewnętrzna stronka w pracy, nawet na służbowym lapku nie działa.

#python #naukaprogramowania

g.....a

konto usunięte 03.04.2022, 10:58:15

@qubas89: Uwaga wirus w linku.

@giguga: ?

@qubas89: For loop i lecisz ja korzystalem ze Scrapiego i on mial (4/5lat temu) wbudowane rozwiazania do automatycznej iteracji ( ͡º ͜ʖ͡º)

g.....a

konto usunięte 03.04.2022, 11:01:09

@qubas89: jak wchodzę w twojego linka to mi pies szczeka w mieszkaniu. Coś tam jest co mi straszy psa.

qubas89

03.04.2022, 11:42:15

@wojna_informacyjna: no ok, ale jak za pomocą zwykłej pętli sprawić, żeby program cofał się katalog wcześniej?

wojna_informacyjna

03.04.2022, 11:53:31

https://docs.scrapy.org/en/latest/topics/selectors.html Nie napisze za ciebie programu ale jak skorzystasz ze scrapiego to predzej czy pozniej ogarniesz ( ͡° ͜ʖ ͡°)

Aktywne Wpisy

tanebau

tanebau +169

5 godz. i 29 min temu

#tesla #cybertruck homologacja? A na co to komu potrzebne, a dlaczego?

gobi12

gobi12 +116

3 godz. i 37 min temu

Pamiętacie ten stół? ( ͡° ͜ʖ ͡°)

Nie jest tak obficie zapełniony jak w poprzednich latach, ale jak na tylko jeden mały tunel to jestem bardzo zadowolony.

18 różnych odmian, z których większość uprawiałem po raz pierwszy. Zwłaszcza, że już od sierpnia sporo dojrzałych owoców podbieralem na różne cele. Dzisiaj zerwałem wszystko co było na ten moment dojrzałe. W tunelu zostało jeszcze 3x to co na stole, ale nadal zielone. Przymrozków na

gobi12 - Pamiętacie ten stół? ( ͡° ͜ʖ ͡°)

Nie jest tak obficie zapełniony jak w popr... — **źródło:** temp_file6670518616501059288
Pobierz

Aktywne Wpisy

Aktywne Znaleziska

Apacze AH-64: Amerykanie rezygnują z połowy, a Polska dopiero czeka na swoje!

Kolejny rodzaj odpadów do segregacji. Ministerstwo rozważy trudną decyzję

Era SMS-ów premium - dzwonki i tapety które drenowały kieszeń nastolatków

Zimne kaloryfery i gorąca atmosfera

Cenzura? Prime Video usuwa b--ń z plakatów Jamesa Bonda

Popularne tagi