Wpis z mikrobloga

Mirki, pytanie odnoścnie #scraping #datamining w #python.

Mam takie "drzewko" jak na zdjęciu. Chcę wyciągnąć coś z ostatniego różowego (powiedzmy tag 3). Jednak jak daję komendę blabla.3 to program wchodzi mi do czerwonego (tag 1) i wtedy do pierwszego różowego (tag 3)) [tak jakbym napisał blabla.1.3]. Jak mu powiedzieć, żeby szedł do ostatniego? Próbowałem funkcją find i findAll, ale nie chce mnie słchać.

#naukaprogramowania #pytaniedoeksperta
ddabadama - Mirki, pytanie odnoścnie #scraping #datamining w #python.

Mam takie "d...

źródło: comment_SYgcCJNe8da9yASLhff7c2sIhvWWLGdt.jpg

Pobierz
  • 7
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@ddabadama: Jak rozumiem, piszemy o HTML? Chodzi Ci o taki tag, który jest ostatni, a co jak będą dwa takie? A może o taki co jest najdalej od 1 (pytanie jw.)? Wiesz, że tam po drodze jest 2?
  • Odpowiedz
@piotrb: Kod mam na innym komputerze, także będzie ciężko.

Właśnie nie mogę. Mogę się dostać do tego przez 3.
Ale jak wpisuje blabla.3 to on nie idzie do 3 tylko do 1.3
  • Odpowiedz
@ddabadama: używasz BeautifulSoup? jak tak to można na zaznaczonym elemencie wywołać .next_sibling, albo możesz użyć css selectora. Co to jest to blabla? Najlepiej jakbyś wrzucił przykładowy html tak jak kolega napisał.
  • Odpowiedz
@ddabadama: Jesli ten html ma zawsze podobny format to moge ci powiedziec jak kiedys zeobilem cos takiego, ale to sposob na pewno nie najlepszy ( ͡° ͜ʖ ͡°)
Uzywasz request by wydobyc html strony.
kazda kolejna linijke html wrzucasz jako osobny element do listy np. htmlcontentlist
Szukasz linii unikatowej ktora jest najblizej twojej szukanej linii w liscie np ta linia oznaczona jako 1.
Znajdujesz jej index w liscie(x)
Linia ktorej szukasz, zawsze
  • Odpowiedz