#scraping - strona 2

04.08.2020, 07:39:40

0

#python #scraping
#programowanie

Mam za zadania ściągać dane z amazona dla produktów które użytkownik wybierze. Zawsze mam wybrać najtańszą opcję(najtańsza opcja łącznie z dostawą). Niestety wyszukiwarka amazona działa dziwnie i nie pokazuje wyników takie jak bym chciał. Przykład może być: szukam tv wyskakują uchwyty pod tv, szukam jakieś elektorniki to wyskakują części zamienne. Nie wiem jak sobie z tym poradzić i wyszukiwać na amazonie poprawnie.

PiotrokeJ

04.08.2020, 10:44:34

0

@luukasek: Wyskakuje bład no module chociaż wszystko zainstalowałem. inni też mają z tym problem.

l.....k

konto usunięte 04.08.2020, 10:46:04

0

@PiotrokeJ: tu masz jeszcze 1 kod.
https://www.scrapehero.com/tutorial-how-to-scrape-amazon-product-details-using-python-and-selectorlib/

k.....l

konto usunięte 14.07.2020, 18:47:40

0

pomógłby ktoś scrapnąć tutaj żeby się logowało jednym linkiem? pls ( ͡° ͜ʖ ͡°)
https://trucksbook.eu/
https://trucksbook.eu/components/notlogged/login.php?go= mam tu coś

#php #programowanie #scraping

k.....l

konto usunięte 14.07.2020, 20:14:44

0

nie chce mi sie

eternalmarcos

14.07.2020, 20:14:56

0

@kam1ll: postaw sobie phantomjs.do tego horsemsn na node i można cisnąć ;)

wiecek3

10.06.2020, 09:44:42

0

Uczyłem się ostatnio trochę webscrapingu. Jakie ciekawe i unikatowe dane mogę ściągnąć żeby poćwiczyć?
Zależy mi, żeby takie dane można było potem w ciekawy sposób analizować, a najlepiej jeszcze zrobić na ich podstawie jakiś model uczenia maszynowego.
Wymyśliłem sobie ściąganie informacji i cen używanych aut oraz mieszkań. Udało mi się już to zrobić, ale takie dane są lekko oklepane. Co jeszcze ciekawego zostało z najlepiej polskich stron internetowych?
#scraping #

ProfesorBigos

10.06.2020, 09:50:53

2

@wiecek3: pozbieraj dane z wykopu, np dla każdego znaleziska lub wpisu listę zwartych tagów, datę dodania, liczbę komentarzy i plusów, a potem zrób model szacujący popularność na podstawie takich danych

wiecek3

10.06.2020, 10:01:56

2

@ProfesorBigos: ej, to jest świetny pomysł! Dziękuję serdecznie, czegoś takiego potrzebowałem! Teraz tylko muszę się zabezpieczyć kilkoma proxy zanim zacznę scrapować, bo jak dostanę bana na wykop to nie wiem co zrobię xD

O.....k

konto usunięte 12.05.2020, 20:35:01

0

Hej wszyscy #programista15k kodujący w #python , pomożecie? Mam #pytanie:

czy istnieje jakaś biblioteka, która w łatwy sposób pozwalałaby pobrać listę list, która zawierałaby n ostatnich znalezisk dodanych do wykopaliska, z linkiem, tagami, tytułem, autorem itp.? Coś jak pages generatory z pywikibot, tylko dla wypoka...

Z góry dziękuję!

#programowanie #scraping #webdev #wykop

terminatorXL

12.05.2020, 20:38:39

2

@Oh_hi_Mark: liba nie znam, ale https://www.wykop.pl/dla-programistow/dokumentacja/ + http.client / request powinno dać radę

croppz

13.05.2020, 00:24:30

1

@Oh_hi_Mark: jakieś pythonowe paczki wrapujące wykopowe api były, ale czy są aktualne to nie wiem. Zresztą nawet jak nie, to to brzmi jak parę linijek kodu. Jakbyś pisał swój kod to polecam requests.

AldoAldo

12.05.2020, 18:47:20 via Android

1

Mirki ma ktoś scrappera do olx pobierającego cenę i powierzchnię mieszkania, albo chciałby zrobić lub pomóc mi zrobić? (Ogarnę na tyle że ściągnę te dane z linku z ogłoszeniem, ale nie ogarnę jak zrobić to tak by 'wbijalo' na każde ogłoszenie i stamtąd ściągało dane. )

#programowanie #scraping #python #scrapy #webdev

asterix61

13.05.2020, 06:44:31

1

@AldoAldo: Tylko jeżeli nie masz doświadczenia, to poczytaj o tym jak uchronić się przed banem. Na jednych warsztatach uczyłem grupę 10 osób scrapowania serwisu aukcyjnego i następnego dnia cały budynek miał na niego bana xd

l.....k

konto usunięte 14.05.2020, 19:10:01

1

@Groosik: @AldoAldo: @wellfix
tu macie cos gotowe:
co robi?

sprawdza ilosc stron z nieruchomosciami

z kazdej strony

zalozyc_bukmacherke_w_afryce

08.05.2020, 16:42:33

1

Da się przez api facebook-a pobierać wszystko ze swojej grupy? Tak aby umieszczać na stronie www jako kontent do pozycjonowania. Jeśli tak, jak to jest w przypadku kiedy nie jesteśmy jej właścicielem? Narusza to jakoś prawa autorskie właściciela innej grupy? Facebook moża jakoś zablokować tą treść?

Czy łatwiej zescrapować treść? Jakiś kod/sposób, który polecacie?

Widzieliście żeby ktoś coś takiego robił?

#facebook #seo #scraping

Wychwalany

08.05.2020, 16:53:20

0

Widzieliście żeby ktoś coś takiego robił?

@zalozyc_bukmacherke_w_afryce: nie, a da się? nigdy nie znalazłem sposobu

AQQry

09.05.2020, 07:00:26 via Android

0

#rodo chyba ty dość mocno wchodzi.

Kubston

02.03.2020, 23:12:34

0

Jest tutaj ktoś kto siedzi w #scraping ? #python

thelinker

02.03.2020, 23:19:30 via Android

0

Jam siedze trochę

a.....w

konto usunięte 03.03.2020, 00:32:11 via iOS

1

@Kubston: Pytaj bezpośredniu mirku

blacktyg3r

26.02.2020, 14:05:06

0

#programowanie #python #scraping #beautifulsoup

Siemka, jest sprawa - dobiłem do ściany i potrzebuję żeby ktoś wskazał kierunek :/.

SEDNO: oglądam tutoriale i próbuję nauczyć się przy pomocy pythona i bs4/ scrapy zebrać dane z giełdy kryptowalut i za cholerę nie umiem - poradniki zawsze omawiają na bazie stosunkowo prostych stron i z tym nie mam problemu, ale jak przychodzi do real-life zazwyczaj dostaję [ ]...

MORE:

blacktyg3r - #programowanie #python #scraping #beautifulsoup

Siemka, jest sprawa -... — **źródło:** comment_1582725862QtVZWBB3n26MO0YYg5XFRY.jpg
Pobierz

croppz

26.02.2020, 14:30:41

5

@blacktyg3r: używasz selenium? Bo problem pewnie jest przez treść renderowaną w js. Zresztą spójrz lepiej w zakładkę network, wszystkie dane są pobierane requestami z api z tego co widzę.

croppz

26.02.2020, 15:33:17

1

@blacktyg3r: skupiłbym się raczej na drugiej części tamtej odpowiedzi. ( ͡° ͜ʖ ͡°)

Strona o której mówisz ma pod spodem api. Dokumentacji może nie mieć, po prostu spójrz jakie requesty robi twoja przeglądarka jak otwierasz stronę i powtórz je w pythonie. Dostaniesz ładnego JSONa z danymi.

croppz - @blacktyg3r: skupiłbym się raczej na drugiej części tamtej odpowiedzi. ( ͡° ... — **źródło:** comment_1582731300ZiiO6Ky2nBtGgofqmijNyP.jpg
Pobierz

Nie_wiem_jak_sie_nazwac

19.02.2020, 08:17:42 via Android

0

Siemka Mirki,
Pytanie z tych banalnych, chciałbym zrobić stronkę, która na żywo tłumaczy słówko po jego naciśnięciu. Jak to wygląda przy scrapowaniu danych ze słowników np. translatica czy babla. Np w babla znalazłem w robots.txt (User-agent: * Disallow: /*&filter Disallow: /*page= Disallow: /*PHPSESSID Disallow: /*profile_show.php* Disallow: /tools/ Disallow: /widgets/ Disallow: /partner/ Disallow: /sounds/ Disallow: /bt.php Disallow: /r/ Disallow: /*verify.php? Disallow: /x/ Disallow: /ax/)
To nie jest wykorzystywanie autorskich dzieł, przynajmniej tak mi

cecyl

19.02.2020, 08:22:27

1

@Nie_wiem_jak_sie_nazwac: Google translator ma chyba API. Jeżeli coś jest w robots wykluczone to zakłada się, że nie można scrapować.

Nie_wiem_jak_sie_nazwac

17.03.2020, 15:06:28 via Android

0

Dla potomnych. Yandex ma free bazę do chyba 5k zapytań dziennie

budyn

11.12.2019, 21:27:13

4

Pisał ktoś scrapera na lubimy czytać?
Mam taki plan, żeby to zrobić, bo brakuje mi u nich sortowania po ocenie.
Tzn taki ranking coś jak na filmwebie.

Mają 350k tytułów, 10 książek na stronę, tzn 35k requestów.
Zakładając 1r/s to by było 3600 na godzinę = 10h do zeskanowania wszystkiego o ile by mnie jakiś rate limiter nie dopadł i zbanował.

K.....t

konto usunięte 11.12.2019, 21:28:31

1

@budyn: nie możesz robić requestów przez tora?

ChestNoot

12.12.2019, 06:06:56 via iOS

0

@budyn: Wrzuć PoC na githuba, tylko z fakowymi URLami

zalozyc_bukmacherke_w_afryce

03.11.2019, 20:43:02

1

Jakiś gotowy scraper do goldenline?

#crawler #scraping #programowanie

dziekuje

04.11.2019, 08:08:49 via iOS

0

@zalozyc_bukmacherke_w_afryce: Nie, ale jak chcesz to mogę coś klepnąć.

ssupkowski

11.07.2019, 07:04:50

0

#programujzwykopem #r #scraping

Bry wieczór.
Scrapera w R sobie piszę, i mam problem z pętlą for, która przekaże wartość do linku.
Za pierwszym razem powinno pójść 1, a później wielokrotność counter (251, 501, 751, itd).

Chcę

bi-tek

11.07.2019, 07:21:42

0

@ssupkowski: Jeżeli jakieś dane są renderowane po wczytaniu contentu np przez javascript to musisz mieć heartless browser i tak to odczytywać bo często dostajesz kod strony który nie jest po wykonaniu js

thomeq

22.06.2019, 21:42:38

1

Szanowi Rezydenci Płci Każdej Miejsca W Internecie Wykopem Zwanego!
Zna ktos metode #scraping w #R żeby wydobyc numer telefonu na #otodom ? Bo nie ogarniam :(
#programowanie

D.....x

konto usunięte 22.06.2019, 21:50:34

2

@thomeq: w javie to można dość szybko ogarnąć z wykorzystaniem jsoup

D.....x

konto usunięte 22.06.2019, 21:55:34

1

@thomeq: no spoko jak chcesz :)

ronek22

14.03.2019, 16:12:11

0

Siema,
Chce zbierać dane o sprzedawanych samochodach osobowych.
Warto się przez te ich rest api podpinac czy mają jakieś limity?
Czy napisać coś swojego w pythonie?

#crawler #scraping #webdev #rest

ronek22

14.03.2019, 22:19:00

0

@ArtekMisiek: rest

ronek22

14.03.2019, 22:20:45 via Wykop Mobilny (Android)

0

@ArtekMisiek: Zapomniałem napisać allegro :)

G.....2

konto usunięte 03.02.2019, 15:47:11

2

#scraping #programowanie #frontend #backend

Siema, piszę sobie scrapera pod oferty pracy OLX i natrafiłem na coś ciekawego.
Scraper biega sobie po każdej kategorii, ściąga dane, zapisuje do bazy, klika następną stronę i tak w kółko...
Zauważyłem, że np. w kategorii Administracja Biurowa po pierwszych 50 stronach baza danych zaczyna mi wypluwać exceptiony związane z tym, że klucz główny (adres www oferty) już istnieje w bazie danych.
"No spoko"

wqdqweff

03.02.2019, 15:48:57

4

@Glowacki92: u mnie na 134 stronie normalnie pojawiają się ogłoszenia.

kuite22

03.02.2019, 16:32:48

4

@hammer404: dobre, gość pyta konkretnie a ten mu z regulaminem wyjeżdża XD

ronek22

11.01.2019, 01:37:00

2

Miałem bota, który pobierał strony po wypełnieniu formularza.
Formularz był zabezpieczony recaptcha v2. Captcha była wypełniana ręcznie.
Jednak, zaktualizowali do v3. Da sie to jakos obejsc, zeby przechodziło, czy z v3 botom mówimy papa?

#programowanie #selenium #scraping #datamining #captcha

ArekJ

11.01.2019, 01:49:26

0

@ronek22: Death by captcha albo podobne tematy? To grosze kosztuje, ale nie wiem czy v3 ogarniają

x.....d

konto usunięte 11.01.2019, 01:51:25

0

Komentarz usunięty przez autora

kurp

11.10.2018, 19:27:29

1

Mirki, pomóżcie! Gdzie znajdę dobrą bazę danych książek, która dałaby się przeszukiwać po ISBN?

Cel: napisać skrypt, który wciągnie listę ISBN zczytaną z kodów kreskowych moich książek, a następnie pobierze z netu i zapisze podstawowe dane - tytuł, autora, a mile widziane także: data wydania, wydawnictwo, liczba stron itp.

Problem: nie mogę znaleźć sensownego źródła; na razie napisałem napisałem to sobie na bazie Arosa (mają sporą i solidnie uzupełnioną bazę,

kurp - Mirki, pomóżcie! Gdzie znajdę dobrą bazę danych książek, która dałaby się prze... — **źródło:** comment_A5ZNDCJ5QfKr9hXMU63ts07hc2ioJ05W.jpg
Pobierz

Metaforzysta

11.10.2018, 20:01:28

2

Treść przeznaczona dla osób powyżej 18 roku życia...

kurp

12.10.2018, 06:55:18

1

@Metaforzysta: No, pytasz, po co mi ten skrypt? Czy po co mi baza moich książek? Czy po co mi umiejętności, które się nabywa robiąc takie ćwiczenia? Czy po co mi frajda, którą czerpię z robienia takich rzeczy?
[wyszło wystarczająco kaszebsko?]

konik_polanowy

18.09.2018, 04:31:51

24

Dzisiaj Python Web Scraping - Second Edition (May 2017)

https://www.packtpub.com/packt/offers/free-learning

#packtpubfreelearning #python #webdev #scraping

konik_polanowy - Dzisiaj Python Web Scraping - Second Edition (May 2017)

https://w... — **źródło:** comment_dH9i9dkxppm548XmjLlwIMA8UkAQxTOv.jpg
Pobierz

Kura_Wasylisa

19.09.2018, 14:20:34 via Android

0

@konik_polanowy
@TymRazemNieBedeBordo
@ppawel możecie podeslac pdf?

ppawel

19.09.2018, 14:37:10

1

@Kura_Wasylisa: widziałem tutaj http://index-of.es/Varios-2/

luki_sk

01.09.2018, 14:33:08

3

jak testujecie spidery (scrapy)? Korzystacie z kaset, np vcrpy?

#python #scrapy #scraping #tdd #programowanie

konik_polanowy

12.07.2018, 04:28:59

26

Python Web Scraping - Second Edition (May 2017)

https://www.packtpub.com/packt/offers/free-learning

#packtpubfreelearning #python #scraping

konik_polanowy - Python Web Scraping - Second Edition (May 2017)

https://www.packt... — **źródło:** comment_l8tgHDjLlG5K5W9dipMI6k9odMKgrv1I.jpg
Pobierz

n1troo

12.07.2018, 06:12:52

18

@konik_polanowy: I cyk kolejna do kolekcji nigdy nie otwieranych książek na wirtualnej półce ;)

lanekrasz

12.07.2018, 10:38:39

1

@poczekaj: Python Crash Course - A Hands-On, Project-Based Introduction to Programming , jak na razie jestem na 80 stronie, wszystko bardzo fajnie i przejrzyscie wytlumaczone.

Jest jeszcze Learning Python - https://www.packtpub.com/packt/free-ebook/learning-python za darmo jest, ale nie korzystalem z tego, na razie przerobie tą pierwszą książkę do końca.