Wpis z mikrobloga

Skopiuj link

18.10.2024, 20:46:09

Staram się poduczyć trochę o programowaniu, no a zawsze się mówi, że najlepiej gdy ma się jakiś projekt. Wymyśliłem sobie, że zliczę sobie łączny czas jaki poświęciłem, na obejrzenie filmów i seriali jakie mam zapisane w bazie Filmwebu. Jako że nie wyciągnę tych informacji z ich danych (nawet nie o to by mi chodziło w tym projekcie), chciałbym zrozumieć jak mogę zautomatyzować proces ściągania tych danych, po prostu korzystając z tych informacji które się wyświetlają na stronie. Nazywa się to chyba metodą webscrappingu?
W każdym razie, nawet nie chodziłoby mi o to, aby czytać każdą informację ze źródła każdej strony (może na pierwszy sposób) - tylko może jakoś zrobić program, który kazałby komputerowi patrzeć w określone miejsce na stronie, rozpoznał co tam pisze, przekonwertował dane do excela.

Chciałbym to zrobić na dwa sposoby, ten drugi, wizualny w ogóle nie wiem jak zacząć. Jak mógłbym to zrobić?

Jeśli chodzi o pierwszy sposób, zapytałem chatagpt, no i do VCS, kazał mi wkleić coś takiego. Zainstalowałem bibliotekę soup w cmd pipem.
Uruchomiony skrypt (z wpisaną poprawną nazwą profilu filmweb), nie generuje nic do zapisanego pliku .csv - więc pewnie chodzi o to że identyfikatory ze strony nie są dobrze ściągnięte. Jak klikając na nazwę filmu na filmwebie, mogę po "zbadaj element" zobaczyć które parametry należy wpisać do skryptu aby dane się zaciągnęły?

#pytanie #programowanie #python #filmweb #webscraping #webdev

interpenetrate

20.10.2024, 18:49:16 via Wykop

@patryk_ekiert: No dobra, rozumiem teraz. Ty klikasz na plakat - ja klikam na tytuł.
Ale to i tak bez znaczenia. W końcu i tak z kodu trzeba wyciągnąć potrzebne informacje.

Czy mógłbyś zerknąć na post jeden nad Twoim i może zobaczyć czy wiedziałbyś jak wyciągnąć te dwie wartości? Albo nawet i sam link będzie ok. Sam link.

Czyli na tej stronie ocen, dynamicznie doczytują się te klasy każdego rekordu kolejnego wraz

venomik

20.10.2024, 18:59:01 via Wykop

Powiedz mi lepiej takie coś. Jakbyś wyciągnął te dwie wartości stąd?

@interpenetrate: Da się. Da się wyciagnąć tekst z każdego elementu

Pokazuje mi się błąd, no że zaciąga tekst (a pewnie dlatego że to

@aseeon_ +1113

Z czego i jak się uczyć pythona edycja trzecia #programowanie #naukaprogramowania #python

██░███░░░░██░████████░██████░░░██████░░
██░████░░░██░░░░██░░░░██░░░██░██░░░░██░
██░██░██░░██░░░░██░░░░██████░░██░░░░██░
██░██░░██░██░░░░██░░░░██░░░██░██░░░░██░

interpenetrate

20.10.2024, 19:59:41 via Wykop

@venomik: Trochę miałem zagwozdkę jak odpisać. Biłem się z myślami czy bardziej próbować Cię pytać czy byś nie chciał robić jakiejś sesji 1h tygodniowo (calla), jakby zostać moim mentorem - czy drążyć do rozwiązania problemu czyli tych dynamicznie doczytujących się klas.

Może najpierw: ale ja nie uczę się selenium, nawet nie wiem co to jest. Beautifulsoupa (jeśłi chodzi o to że używam tej biblioteki w kodzie) wygenerował mi gpt.

Pycharm nie

venomik

20.10.2024, 21:47:04 via Wykop

@interpenetrate:

Odpowiem anegdotą.
Jest w IT coś takiego, jak metoda gumowej kaczki. Obecnie już nie tylko w IT. Polega to na tym, że jak nie wiesz dlaczego Twój kod nie działa, to bierzesz sobie gumową kaczuszkę i próbujesz jej wyjasnić po kolei o co w tym kodzie chodzi.
Polega to na tym, że jak próbujesz coś łopatologicznie wyjasnić komuś, to łatwiej Ci jest znaleźć błąd w Twoim

Kocurzysko

21.10.2024, 06:58:17 via Wykop

@interpenetrate: przedmówca z kaczka na profilowym ma rację. Jeżeli nie umiesz podstaw programowania to od tego zacznij. Bo jeżeli chodzi o problem który napisałeś w głównym poście to to jest 15 minut na ogarnięcie jak to zrobić i drugie tyle na zrobienie. I do tego dodać 2-3/h na wysypywanie się programu i denerwowanie się na selektory.
Ogarnij sobie podstawy z tego linku co tam wyżej jest, w którym mirek linkowal

interpenetrate

16.03.2025, 14:03:36 via Wykop

@patryk_ekiert: @venomik @Kocurzysko Mirki, wiecie co. skończyłem w miarę ten kod. Gdyby nie pomoc kumpla programisty to by się nie udało a gdyby nie gpt to by się nie skończyło, ale chciałem zapytać o review tego co zrobiłem. Pisaliście że mogę się odzywać jakby coś, mój kod może być toporny (wiecie, dla mnie to spotkanie z najwyższym xd), ważne żebym zrozumiał dlaczego jest co nie. Jest dostępny tutaj

Aktywne Wpisy

krystian-stepaniak

krystian-stepaniak +182

6 godz. i 1 min temu

Ja p------ę one mają ego wielkości galaktyki xD
#p0lka #tinder #logokarozowychpaskow #blackpill #redpill

krystian-stepaniak - Ja p------ę one mają ego wielkości galaktyki xD
#p0lka #tinder #... — **źródło:** Zdjęcie z biblioteki
Pobierz

NarciarzFarciarz

NarciarzFarciarz +133

4 godz. i 29 min temu

Czas na ostatni wpis z mojej serii #emigracja w #kanada

POWRÓT DO POLSKI PO DWÓCH LATACH W KANADZIE

Wyjeżdżając do Kanady mieliśmy plan zostać tam na stałe lub w najgorszym wypadku- przepracować 5 lat i wrócić do Polski z wielkimi oszczędnościami. Wytrzymaliśmy prawie dwa lata. Kanada nas zmieliła i wypluła.

WPIS

NarciarzFarciarz - Czas na ostatni wpis z mojej serii #emigracja w #kanada

POWRÓT DO... — **źródło:** 20250713_192451
Pobierz

Aktywne Wpisy

Aktywne Znaleziska

Kuriozalne zachowanie Polaka na MŚ i szokujące słowa

Rząd chce ustawy która wzmocni pozycję rolników na wsi

Odwet miasta po nielegalnej wycince. "To ostrzeżenie"

Polska badaczka ma sposób na wydzielanie cennych surowców ze zużytych baterii

Będzin: Agresywne psy zaatakowały starszą kobietę i jej psa

Popularne tagi