Robię sobie pewną stronę, na której potrzebuję mieć aktualne dane na temat cen paliw. Chciałbym aby przy każdorazowym odświeżeniu strony ceny zostały pobierane ze stron producentów lub innych, które oferują podgląd takich danych. Później chciałbym te ceny umieścić w konkretnym divie i konkretnym znaczniku p. Dodatkowo zapisać je w jakimś jsonie. No i teraz pojawia się pytanie. Czym pobierać te dane? Python? Kompletnie nie wiem jak się za to zabrać także jeżeli ktoś naprowadziłby mnie na to czego użyć to byłbym wdzięczny. #webdev #programowanie
@TeflonDon: Aktualnie widzę 2 możliwe opcje. 1. Szukasz producentów którzy wystawiają swoje restowe api, podpinasz je sobie i zaczynasz po prostu korzystać. 2. Jeśli producenci nie mają restowego api możesz spróbować pobierać kod html ich stron internetowych i szukać jakimś regexem elementu który zawiera cenę. 2. Rozwiązanie ma tą wadę że jakakolwiek zmiana struktury strony html może spowodować złe działania tego regexa. Ponadto ciągłe parsowanie htmla i szukanie w nim regexa
@roszd23: bardziej skłaniam się ku rozwiązaniu nr 2. Z tego co obserwowałem to struktura strony się nie zmienia więc to nie będzie problem. Jeżeli chodzi o parsowanie to strona umrze śmiercią naturalną za jakieś 4-5 miesięcy, w tym czasie nie planuję wzmożonego odświeżania itd. także myślę, że źle nie będzie. Tylko czym teraz pobierać te dane? Pythonem i wgetem?
#webdev #programowanie
1. Szukasz producentów którzy wystawiają swoje restowe api, podpinasz je sobie i zaczynasz po prostu korzystać.
2. Jeśli producenci nie mają restowego api możesz spróbować pobierać kod html ich stron internetowych i szukać jakimś regexem elementu który zawiera cenę.
2. Rozwiązanie ma tą wadę że jakakolwiek zmiana struktury strony html może spowodować złe działania tego regexa.
Ponadto ciągłe parsowanie htmla i szukanie w nim regexa
Powinno pójść w miarę łatwo ( ͡º ͜ʖ͡º)
http://stackoverflow.com/questions/20045955/regex-pattern-in-python-for-parsing-html-title-tags