Wpis z mikrobloga

#programowanie #it #webdev #pytaniedoeksperta
Siema mirki, zwracam się do was z pytaniem bo nawet nie wiem gdzie i czego zacząć szukać.
Mam pewną stronke internetową do której potrzebowałbym napisać coś w rodzaju skryptu albo jakiegoś innego pluginu który będzie zczytywał dane ze strony (zwykły tekst i cyfry) i wklejał to kolejno do excela albo innej bazy danych którą później będę mógł jakoś statystycznie obrobić. Nie jest to duża częstotliwość (3/4/5 razy dziennie), ale będąc w pracy czy w drodze nie mam możliwości tego zrobić manualnie, a że mam raspberry pi to myślałem o zaadaptowaniu tego urządzonka w tym celu.
W jakim języku takie coś najlepiej napisać? Jestem wybitnie zielony w temacie programowania (poza cnc), więc fajnie by było jakby ktoś chociaż nakierował czego szukać albo jak wyciągnąć dane z strony.
  • 7
@januzi: powiedz mi jeszcze mireczku bo zapomniałem dopisać w zapytaniu. Potrzebuje żeby ten twór który wykreuje wchodził na jedną strone, klikał "sprawdź", zczytywał dane, wklejał do excela, a później przechodził na kolejną "pod" stronę, znowu kopiował i wklejał do excela. Da rade to tym webscraperem i pythonem ogarnąć?
@cornyRDW: Python, pobierasz HTML strony, przetwarzasz strukturę i wyciągasz, czego potrzebujesz. Aby odpalać regularnie ten skrypt na linuxie, obudowujesz to w CRON
@cornyRDW: Jeśli za każdym razem odwiedzane mają być dwie strony o tym samym adresie, to albo odpalasz dwa razy, albo jedziesz w pętli po adresach
Ważne, żeby ta strona, z której wyciągasz dane, miała tę samą strukturę. Jeśli coś się zmieni, to pobieracz danych będzie wyciągać nie to, co trzeba.
@januzi: No właśnie, niby strony mają taką samą strukturę już od jakiegoś czasu, ale wypadałoby to zabezpieczyć na przyszłość (chyba zę struktura strony to kod html, w takim razie nie jestem w 100% pewien). Jest jakaś opcja typu ctrl+f żeby szukało danego ciągu znaków?