Wpis z mikrobloga

Skopiuj link

konto usunięte 13.11.2021, 20:28:55

#scrapy #python #programowanie

siema. nie wiem gdzie robię błąd. To nie pierwszy crawler jakiego piszę ale miałem długą przerwę i gdzieś daję ciała.

chcę ściągnąć ceny z castroramy. Dla przykładu niech będą to dywany. Korzystając z biblioteki #scrapy zadaję takie pytanie:

response.xpath('//span[contains(@class, "price-box__value")]/text()').extract()
niestety dostaję pustą listę.

link do strony jaką mam podpiętą pod fetcha: https://www.castorama.pl/produkty/urzadzanie/wykonczenie-podlogi/dywany.html

na załączonym zdjęciu widać, że zapytanie jest dobre. Nazwy tych dywanów pobiera mi tak jak trzeba.

k.....u - #scrapy #python #programowanie

siema. nie wiem gdzie robię błąd. To nie ... — **źródło:** comment_1636835231e29yHol9ahlIgnlpX5VkFm.jpg
Pobierz

k.....u

konto usunięte 13.11.2021, 20:29:10

@koku: 15 linijka

skull_pain

13.11.2021, 20:31:25

@koku: ' " nie ma różnicy?

k.....u

konto usunięte 13.11.2021, 20:35:13

@skull_pain: generalnie to trzeba zamykać tymi, którymi się otwieraja. Nie ma znaczenia czym zaczniesz ale zamieniłem je tak jak są w wierszu 14 i dalej ten sam problem.

a.....r

konto usunięte 13.11.2021, 20:36:28

@koku: nie znam się, ale gdybyś dał
`contains(@class='price-box_value')'
nie zadziałałoby?

saviola7

13.11.2021, 20:38:27

@avoner: To wtedy chyba musiałbyś "wyescape'ować" je odpowiednio.

Hunchbacked

13.11.2021, 20:38:57

@koku: dlaczego price-box_value ? skoro tam jest price-box a w nim cena

k.....u

konto usunięte 13.11.2021, 20:45:47

@Hunchbacked: div nie ma ceny tylko span. a to div ma klasę "price-box"

k.....u

konto usunięte 13.11.2021, 20:47:02

To wtedy chyba musiałbyś "wyescape'ować" je odpowiednio.

@saviola7: sorki, nie czaję :)

k.....u

konto usunięte 13.11.2021, 20:48:58

nie znam się, ale gdybyś dał

`contains(@class='price-box_value')'

nie zadziałałoby?

@avoner: niestety wtedy crawler sie wywala całkowicie.

k.....u

konto usunięte 13.11.2021, 20:52:59

k.....u - :( — **źródło:** comment_1636836776RzbSXjqzlqDvZW34KGjFWJ.jpg
Pobierz

Oleej

13.11.2021, 20:55:00 via Wykop Mobilny (Android)

@koku: ' -> " ? ;)

k.....u

konto usunięte 13.11.2021, 20:57:17

@Oleej: nie ma znaczenia, już to sprawdzałem :(

Oleej

13.11.2021, 21:01:48 via Wykop Mobilny (Android)

@koku: a próbowałeś wyrzucić to contains i po prostu wrzucić pełną nazwę klasy? Ewentualnie spróbuj cssem zamiast xpathem jeśli jest taka opcja

k.....u

konto usunięte 13.11.2021, 21:14:03

a próbowałeś wyrzucić to contains i po prostu wrzucić pełną nazwę klasy?

@Oleej: tak. tylko tam gdzie jest spacja w nazwie klasy wstawiałem kropkę. Muszę sobie przypomnieć jak zapytać cssem ;)

Spofity

13.11.2021, 21:24:17

@koku: z tego co widzę, to przy odświeżaniu ceny pojawiają się jako ostatnie. Czyli jest możliwe, że ceny są wrzucane JavaScriptem lub czymś podobnym. Nie wiem jak scrapy, ale np. beautifulsoup tego nie znajdzie bo request jest bez danych 'dynamicznych'

Oleej

13.11.2021, 21:50:41 via Wykop Mobilny (Android)

@koku: .price-value price-boxvalue
Ewentualnie
[class='price-value price-boxvalue']
Albo
[class*='price-box_value']

Spofity

13.11.2021, 21:52:18

@koku: selenium wypluł co trzeba

k.....u

konto usunięte 14.11.2021, 10:15:22

@Spofity: kolego podzieliłbyś się kodem z selenium jaki napisałeś? muszę to ogarnąć w ten sposób a nigdy wcześniej z tego nie korzystałem. Z góry dziękuje.

Spofity

14.11.2021, 11:57:06 via Wykop Mobilny (Android)

@koku: pewnie, napisz na PW to po 15 podrzucę

Z.....a

konto usunięte 14.11.2021, 20:16:55

@koku: Na cholere to scrapować jak pod spodem to gada jsonem
https://www.castorama.pl/bold_all/data/getProductPriceStockByStore/?isAjax=true&store=1&typeBlock=recommended&needData=1144428,1144427,1144426,1144425,1144424,1144423,1108705,1108702,1107172,1098690,1098684,1098683,1098682,1055998,1055997,1055995,1055994,1055982,1055971,1055970,1029408,1021517,1015206,1005872,1005398,87198,86963,86961,86957,86956,86955,86954,86953,86952,86950,86948,46123

Aktywne Wpisy

WielkiNos

WielkiNos +122

3 godz. i 6 min temu

Czy można zrobić reklamę na wyzywaniu i poniżaniu kobiet? Tak! Na taki pomysł wpadła jedna z pizzerii w Lublinie zapraszając do siebie hasłem: "zabierz lochę do Rykowiska" co bardzo spodobało się męskiej części klienteli. Damska miała wiele zastrzeżeń co panie wyraziły w komentarzach. Pizzeria je pousuwała, ale nie bez dodatkowego obrażania klientek.

Tutaj pewnie też się to wielu facetom spodoba i będą do tego walić konia wszak nic tak nie cieszy samca

WielkiNos - Czy można zrobić reklamę na wyzywaniu i poniżaniu kobiet? Tak! Na taki po... — **źródło:** temp_file2259362655799596763
Pobierz

MG78

MG78 +310

2 godz. i 48 min temu

Co ja taki szczęśliwy?

A bo napisałem książkę o japońskim rosole ( ͡° ͜ʖ ͡°)

I to nie jedną, i właśnie dotarła z drukarni do magazynu więc mega się cieszę, bo mogłem wziąć ją pierwszy raz do rąk i mega

MG78 - Co ja taki szczęśliwy?

A bo napisałem książkę o japońskim rosole ( ͡° ͜ʖ ͡°)
... — **źródło:** 62425233-E3C0-4524-8845-D7495FA593CF
Pobierz

Aktywne Wpisy

Aktywne Znaleziska

Nie żyje Quincy Jones, producent Thrillera i We Are The World

Pokazał, jak Apple naciąga klientów na kasę. Ośmieszył ich model biznesowy małą

Tysiące Polaków "nabitych" w pompy ciepła. Skarżą się na rachunki. "No, dramat!"

Raport NIK: 100 miliardów, na zieloną transformację w Polsce, poza kontrolą

Bank Santander kazał emerytce spłacać cudzy kredyt.

Popularne tagi