Problem w Pythonie: Mam taką zagwozdkę - normalnie by odnaleźć/kliknąć/cokolwiek dany obiekt w przeglądarce, robi się inspekcję tego obiektu, potem po tagach się go nawiguje, ładuje się selenium i tyle.
Natomiast co należy zrobić, jeżeli taka strona ma obiekty (guziki), których nie da się kliknąć prawym przyciskiem myszy i dać inspekcji? Najczęściej się to zdarza, jak jakaś aplikacja jest po prostu wyświetlana przez przeglądarkę (w pracy). Czy macie jakieś pomysły, jak to ogarnąć w Python? Czy zostają mi tylko biblioteki do nawigowania myszką i klawiaturą?
@Zarzutkowicz to będą tzw. "brittle selectors" - przy większej ilości danych mogą nie być unikatowe i możesz po akcji "click" nie zawsze trafić tam gdzie chcesz. Może zmienić się dany element, klasy lub id mogą być generowane dynamicznie, może zmienić się struktura DOM i im więcej zależności (np. "class > id > attribute1 > node" może szybko być już nieaktualne). To samo tyczy się XPath, warto szukać drzewo od razu po
Problem w Pythonie:
Mam taką zagwozdkę - normalnie by odnaleźć/kliknąć/cokolwiek dany obiekt w przeglądarce, robi się inspekcję tego obiektu, potem po tagach się go nawiguje, ładuje się selenium i tyle.
Natomiast co należy zrobić, jeżeli taka strona ma obiekty (guziki), których nie da się kliknąć prawym przyciskiem myszy i dać inspekcji? Najczęściej się to zdarza, jak jakaś aplikacja jest po prostu wyświetlana przez przeglądarkę (w pracy).
Czy macie jakieś pomysły, jak to ogarnąć w Python? Czy zostają mi tylko biblioteki do nawigowania myszką i klawiaturą?
Pomuszcie :)
PS. Tak, musi to być Python.
#python #selenium #webscraping
Może zmienić się dany element, klasy lub id mogą być generowane dynamicznie, może zmienić się struktura DOM i im więcej zależności (np. "class > id > attribute1 > node" może szybko być już nieaktualne). To samo tyczy się XPath, warto szukać drzewo od razu po