Wpis z mikrobloga

Skopiuj link

02.01.2023, 17:55:49

Dzień dobry, szukam biblioteki do webscrapingu, najważniejszym parametrem jest chyba szybkość. popróbowałem requests plus bs4, problem jednak w tym że jest wolno. Chce ten kod wsadzić do programu okienkowego, więc najchętniej bym przyspieszył jakoś dostęp do danych, by poprawić płynność.
#python #webscraping

@Xardin: scrapy

przyspieszył jakoś dostęp do danych, by poprawić płynność.

@Xardin: niech zgadnę, nie scrapujesz w osobnym wątku, prawda? Poczytaj sobie o threadingu.

Xardin

02.01.2023, 18:02:29

@cohontes: Dzięki

@zwei: Również dzięki, choć trzeba zaznaczyć że na razie tylko testuje sam scraping i to nie tak wielkiej liczby obiektów, więc problemem jest chyba tylko te 2-4 sekundy logowania requests.

s3b4

02.01.2023, 18:05:18

więc problemem jest chyba tylko te 2-4 sekundy logowania requests.

@Xardin: brzmi jak by problem był po drugiej stronie. sprawdź ile te requesty trwają.
(i też jestem za scrapy w wielu wątkach)

emitar

02.01.2023, 18:08:49 via Android

@Xardin codziennie będziesz coś ściągał czy jednorazowa akcja?

Xardin

02.01.2023, 18:16:32

@emitar: jako element programu który opublikuje na githubie. Czyli ilekroć ktoś będzie chciał skorzystać, program będzie zaciągał te rzeczy.

cohontes

02.01.2023, 18:23:56

@Xardin: zdajesz sobie sprawę, że niektóre strony są bardzo dynamiczne i xpath potrafi się dosyć często zmienić, więc taki kod na githubie może być po paru dniach już do poprawy.

Xardin

02.01.2023, 18:28:36

@cohontes: to prawda, ale źródło z którego korzystam raczej się nie zmienia zbyt często.

Xardin

07.01.2023, 10:47:17

@cohontes: Cześc, miałbym jeszcze pytanie do tego. Czy jestem w stanie używać stworzonego scrapera wewnątrz programu? No bo działa to tak że pobieram dane i następnie je przetwarzam, liczę, rysuje jakieś wykresy itd. Czyli potrzebuje mieć dane w programie. Te projekty w scrapy z tego co widzę są dosyć mocno samodzielne i nie wiem w zasadzie jak zescrapowane dane przechwycić bezpośrednio do programu na nich operującego, czy to jest możliwe? celuje

Aktywne Wpisy

KRZYSZTOF_DZONG_UN

KRZYSZTOF_DZONG_UN +103

5 godz. i 3 min temu

Wysłałem przez ostatni miesiąc około 100 CV. Efekt – 1 rozmowa o pracę, na której zostałem odpalony i nie przeszedłem rekrutacji. Reszta ofert, na które aplikowałem CISZA.

Wysłałem przez ostatni miesiąc około 1000 zaproszeń/polubien na różnych aplikacjach randkowych. Efekt – 4 pary, z czego 3 to jakieś fejk konta/scamy i jedna – 36-letnia bezrobotna bambaryła z 3 bękartów. (Nie pytajcie czemu dałem jej lajka, po prostu każdego dodawałem).

Chciałem się wyprowadzić od