Wpis z mikrobloga

#python #programowanie

Mam x plików .xml w których trzeba poprawić kod pocztowy bo API DHL je odrzuca (nieprawidłowy kod pocztowy dla miasta). Obecnie robię to ręcznie tj wchodzę na stronę DHL, wpisuje miasto, ulica i formularz mi automatycznie zwraca prawidłowy kod pocztowy w inpucie i wklepuje go do tego xmla. Chciałbym to zautomatyzować tj. wrzucam XMLe z nieprawidłowymi kodami pocztowymi do folderu, odpalam skrypt który sam zaczyta miasto i ulice z XML, wpisze je na stronie DHL, pobierze kod pocztowy z konkretnego inputa i podmieni w XML.

O ile wyprowadzenie z XML'a miasta/ulicy do postaci zmiennej to nie problem dla mnie (bs4/xmltree) tak z pobraniem ze strony kodu pocztowego jest problem.

API DHL nie daje możliwości pobierania kodu pocztowego po podaniu miasta i ulicy więc jestem zmuszony chyba do użycia jakiego web scrapera.

Moje pytanie brzmi, jaka biblioteka nada się do takiego zadania najlepiej? Selenium, scrapy, bs4, a może coś jeszcze innego?
  • 3
  • Odpowiedz
@Hauleth: widziałem to, ale często jest sytuacja gdzie dla danej ulicy jest inny kod pocztowy, ta lista tego nie uwzględnia. Np warszawa, masz x kodów dla danej dzielnicy. Ta lista owszem, pokazuje wszystkie kody dla warszawy ale nie pokazuje dla jakiej ulicy/dzielnicy ma zastosowanie :/

@xulek: Testuje to i ma obiecujące wyniki, póki co trafia z kodami pocztowymi i podoba mi się sposób zapytań. Dzięki wielkie!
  • Odpowiedz