Aktywne Wpisy
pieknylowca +357
Dzień matki u inwestorów #frajerzyzmlm
g0blacK +423
Ciekawe czy gdzieś tam w środku mają świadomość tej #!$%@? w jakiej są. Czy siedząc w hotelu, albo robiąc 50 zdjęć jakiejś przystawki za 7euro i będąc 16 w kolejce do zrobienia sobie zdjęć w wypożyczonym samochodzie, przychodzi refleksja? Czy oni sobie nawzajem są w stanie spojrzeć w twarz? Czy zdają sobie sprawę jakimi odpadami społecznymi są, którzy poświęcili często najbliższe znajomości i pieniądze rodziny, żeby świadomie robić z siebie debila w
link do przykładowego meczu: https://www.whoscored.com/Matches/1464189/Live/France-Ligue-1-2020-2021-Marseille-Lyon
#python
#scraping
@tyrytyty: e tam, odpowiedź dostałeś choć opryskliwą ( ͡° ͜ʖ ͡°)
Scrapowanie meczu z whoscored:
1) Przeanalizuj obiekt meczu który podesłałem, sprawdź czy zawiera wszystkie informacje, czy może jest to tylko część.
2) Przeanalizuj kilka obiektów z innych meczy, tak żeby mieć pewność, że rozumiesz jak ten obiekt jest zbudoway
3) zakładam, że obiekt meczu zawiera wszystkie potrzebne dane Gdy będziesz mieć pewność, że wiesz gdzie znajdują się dane i jaki mają format, pobierz źródło strony i wytnij
jak googlowałem to ludzie chcieli pojedynczo selenium każdy event wyciągać XD dałbym sobie jaja uciąć że jak sprawdzałem źródło strony wcześniej to te dane nie były zapisane prosto w kodzie
Po co Ci selenium? Ściąganie strony i wyciąganie obiektu to 5-10 linijek w pythonie. Zapniesz selenium, 3 dni będziesz się uczył jak
@tyrytyty: żeby Ci to wyświetlić w przeglądarce to musi jakieś dane pobrać, nie sprawdzałem dokładnie czy po wejściu w podsumowanie meczu pobiera Ci wszystko, czy dodatkowe staty są pobierane po kliknięciu w zawodnika czy jakieś statystyki meczowe, jeśli to drugie to musisz wywołać jeszcze zdarzenia kliknięcia tych
@pp53: bo musisz udawać przeglądarkę, inaczej whoscored zwróci Ci gówno. Jak użyjesz requests to gówno dostaniesz z whoscored bo wykrywa, że to crawler, a nawet jak ustawisz user-agenta i inne dane to nie obsłużysz jsa
Po co wykonywać jakiegoś JSa?
@tyrytyty: Kod do pobierania tego obiektu z whoscored, bez selenium, 7 linijek w pythonie:
import urllib2
import re
response = urllib2.urlopen("https://www.whoscored.com/Matches/1464189/Live/France-Ligue-1-2020-2021-Marseille-Lyon")
page_source = response.read()
pattern = re.compile("var matchCentreData = ((.|\n)*)var matchCentre")
match = pattern.search(page_source)
print match.group(1)
Request unsuccessful. Incapsula incident ID: 324000610002252970-6000812363091779
( ͡° ͜ʖ ͡°)