Wpis z mikrobloga

Staram się poduczyć trochę o programowaniu, no a zawsze się mówi, że najlepiej gdy ma się jakiś projekt. Wymyśliłem sobie, że zliczę sobie łączny czas jaki poświęciłem, na obejrzenie filmów i seriali jakie mam zapisane w bazie Filmwebu. Jako że nie wyciągnę tych informacji z ich danych (nawet nie o to by mi chodziło w tym projekcie), chciałbym zrozumieć jak mogę zautomatyzować proces ściągania tych danych, po prostu korzystając z tych informacji które się wyświetlają na stronie. Nazywa się to chyba metodą webscrappingu?
W każdym razie, nawet nie chodziłoby mi o to, aby czytać każdą informację ze źródła każdej strony (może na pierwszy sposób) - tylko może jakoś zrobić program, który kazałby komputerowi patrzeć w określone miejsce na stronie, rozpoznał co tam pisze, przekonwertował dane do excela.

Chciałbym to zrobić na dwa sposoby, ten drugi, wizualny w ogóle nie wiem jak zacząć. Jak mógłbym to zrobić?

Jeśli chodzi o pierwszy sposób, zapytałem chatagpt, no i do VCS, kazał mi wkleić coś takiego. Zainstalowałem bibliotekę soup w cmd pipem.
Uruchomiony skrypt (z wpisaną poprawną nazwą profilu filmweb), nie generuje nic do zapisanego pliku .csv - więc pewnie chodzi o to że identyfikatory ze strony nie są dobrze ściągnięte. Jak klikając na nazwę filmu na filmwebie, mogę po "zbadaj element" zobaczyć które parametry należy wpisać do skryptu aby dane się zaciągnęły?

#pytanie #programowanie #python #filmweb #webscraping #webdev
interpenetrate - Staram się poduczyć trochę o programowaniu, no a zawsze się mówi, że...

źródło: obraz_2024-10-18_224638301

Pobierz
  • 25
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@patryk_ekiert: No dobra, rozumiem teraz. Ty klikasz na plakat - ja klikam na tytuł.
Ale to i tak bez znaczenia. W końcu i tak z kodu trzeba wyciągnąć potrzebne informacje.

Czy mógłbyś zerknąć na post jeden nad Twoim i może zobaczyć czy wiedziałbyś jak wyciągnąć te dwie wartości? Albo nawet i sam link będzie ok. Sam link.

Czyli na tej stronie ocen, dynamicznie doczytują się te klasy każdego rekordu kolejnego wraz
  • Odpowiedz
Powiedz mi lepiej takie coś. Jakbyś wyciągnął te dwie wartości stąd?


@interpenetrate: Da się. Da się wyciagnąć tekst z każdego elementu

Pokazuje mi się błąd, no że zaciąga tekst (a pewnie dlatego że to
  • Odpowiedz
@venomik: Trochę miałem zagwozdkę jak odpisać. Biłem się z myślami czy bardziej próbować Cię pytać czy byś nie chciał robić jakiejś sesji 1h tygodniowo (calla), jakby zostać moim mentorem - czy drążyć do rozwiązania problemu czyli tych dynamicznie doczytujących się klas.

Może najpierw: ale ja nie uczę się selenium, nawet nie wiem co to jest. Beautifulsoupa (jeśłi chodzi o to że używam tej biblioteki w kodzie) wygenerował mi gpt.

Pycharm nie jest płatny z trialem na 30dni? Oglądając YT, informacje uzyskałem takie że lepiej ściągnąć visual studio do ogólnych rzeczy. Jakiś czas temu rozpocząłem to: udemy.com/course/100-days-of-code/ - ale jak na razie odpadłem. Teraz znalazłem jakieś zastosowanie programowania (żeby odpowiedzieć sobie na jakieś tam pytanie związane z tym filmwebem) no i stąd ten temat. To co podlinkowałeś też obczaje,
  • Odpowiedz
@interpenetrate:

Odpowiem anegdotą.
Jest w IT coś takiego, jak metoda gumowej kaczki. Obecnie już nie tylko w IT. Polega to na tym, że jak nie wiesz dlaczego Twój kod nie działa, to bierzesz sobie gumową kaczuszkę i próbujesz jej wyjasnić po kolei o co w tym kodzie chodzi.
Polega to na tym, że jak próbujesz coś łopatologicznie wyjasnić komuś, to łatwiej Ci jest znaleźć błąd w Twoim
  • Odpowiedz
@interpenetrate: przedmówca z kaczka na profilowym ma rację. Jeżeli nie umiesz podstaw programowania to od tego zacznij. Bo jeżeli chodzi o problem który napisałeś w głównym poście to to jest 15 minut na ogarnięcie jak to zrobić i drugie tyle na zrobienie. I do tego dodać 2-3/h na wysypywanie się programu i denerwowanie się na selektory.
Ogarnij sobie podstawy z tego linku co tam wyżej jest, w którym mirek linkowal
  • Odpowiedz