Wpis z mikrobloga

Skopiuj link

15.02.2022, 11:34:01

Jakieś dwa lata temu chwaliłem się stworzeniem strony archiwizującej opóźnienia pociągów PKP i generującej proste prognozy opóźnienia na kolejny dzień.

Dziś chwalę się drugi raz, bo zaktualizowałem serwis do wersji 2.0 (na razie w wersji beta). Wersja ta zawiera dużo nowych funkcjonalności, całkowicie nowy UI oraz stworzony od podstaw model machine learning prognozujący opóźnienia pociągów na podstawie szeregu czynników, w tym opóźnień z poprzednich dni, różnych cech pociągu oraz danych pogodowych. Co więcej, model podaje również listę najważniejszych czynników na podstawie których wygenerował daną prognozę (starałem się, aby model był "interpretowalny").

W skrócie, na stronie "Czy pociąg się spóźni?" sprawdzicie:
- historyczne opóźnienia zdecydowanej większości (jeśli nie wszystkich) pociągów krajowych (do 30 dni wstecz)
- aktualne opóźnienia - poglądowo (opóźnione ok. 10-50 min w stosunku do Infopasażera)
- prognozowane opóźnienia - na kolejny kurs pociągu

Serdecznie zapraszam do wypróbowania na https://www.czypociagsiespozni.pl i podzielenie się feedbackiem!

#pkp #pociagi #pociag #chwalesie #sztucznainteligencja #machinelearning #programowanie

j.....l

konto usunięte 15.02.2022, 12:03:48

@grad: uwielbiam takie oddolne projekty kompilujące dostępne informacje do użytecznej wiedzy. napiszesz kilka słów o stosie technologicznym, algorytmach, źródłach danych?

grad

15.02.2022, 12:16:26

@jabl: Pewnie! Inspiracją do projektu był projekt Infopasażer Archiver (http://ipa.lovethosetrains.com/) oraz powiązane z nim repozytorium https://github.com/tmaciejewski/ipa. Moja część to modyfikacje kodu tak, aby działał efektywniej i pobierał dane dla wszystkich, albo przynajmniej zdecydowanej większości pociągów, modelowanie danych oraz opakowanie wszystkiego w jak najbardziej przyjazny użytkownikowi UI.

Sam serwis jest oparty na Django + baza w Postgresie. Zintegrowany jest z Infopasażerem poprzez wspomnianą wyżej i zmodyfikowaną bilbiotekę ipa, a także zintegrowany

cohontes

15.02.2022, 12:25:14

@grad: co ile trenujesz model, jeśli masz nowe dane dostępne? Trenujesz wtedy na całym zbiorze czy tylko z jakiegoś okresu, np. ostatni rok?

przykra_sprawa

grad

15.02.2022, 12:34:26

@cohontes: Obecny model został wytrenowany na danych obejmujących okres 24 miesięcy i staram się utrzymać ten interwał chociażby po to, żeby model "nauczył się" interpretować miesiące czy też pory roku. Chociaż oczywiście to nie jest koniec i będę próbował też innych podejść.

Sprawdzam na bieżąco faktyczną realizację prognoz (generuję prognozy na wszystkie kombinacje pociąg+stacja) na około północy i sprawdzam potem w trakcie dnia jaki performance miał model na rzeczywistych opóźnieniach. Jeśli

pwone

15.02.2022, 13:11:55

Długość trasy pociągu do momentu zatrzymania na tej stacji (0.8 h)

@grad: Nie czaje tego opisu. I czemu 0.8h skoro prawie wszystko inne jest podane w minutach?

grad

15.02.2022, 13:17:48

@pwone: Chodzi tutaj o to, jak długo jedzie pociąg zanim przyjedzie do stacji którą wybrałeś (licząc od stacji początkowej). Generalnie czym „dalej” dana stacja jest od stacji początkowej pociągu, tym większe (z reguły) jest ryzyko opóźnienia, bo więcej opóźnienia pociąg może nabrać „na trasie”. Przykładowo, pociąg Warszawa - Szczecin będzie miał wyższe ryzyko opóźnienia na stacji Szczecin niż na stacji Sochaczew (jedna z pierwszych stacji).

Może masz propozycję jak można by

pwone

15.02.2022, 13:30:20

Może masz propozycję jak można by nazwać ten punkt, aby był bardziej zrozumiały?

@grad: Może coś w stylu: "czas podróży (wg rozkładu) od stacji początkowej".

optymistycznypesymista

15.02.2022, 16:49:56 via Wykop Mobilny (Android)

@grad: opcja wg stacji powoduje niemiłosierny freez przeglądarki (przynajmniej na tel)
Poza tym bardzo fajna koncepcja

Hiobe

15.02.2022, 16:56:32 via iOS

@grad: Super leci plusik

Solitary_Man

15.02.2022, 17:03:23 via Android

@optymistycznypesymista

@grad: opcja wg stacji powoduje niemiłosierny freez przeglądarki (przynajmniej na tel)

Poza tym bardzo fajna koncepcja
To samo mam

grad

FaterAnona

15.02.2022, 17:04:02

Jeśli chodzi o modelowanie, to po wielu różnych testach zdecydowałem się na model oparty na zbiorze drzew decyzyjnych (w oparciu o bibliotekę XGBoost),

@grad: jakie R^2 wariacie?

ajgoron

15.02.2022, 17:16:14

@grad: a Panie, super. Jakie technologie?

grad

xGreatx

15.02.2022, 17:18:03

@grad: Daj jakieś sortowanie alfabetyczne stacji.

przykra_sprawa

hitherto

15.02.2022, 17:19:28

@grad: może dałoby się rozróżniać litery o/ó i z/ź ? Raczej nikła szansa że ktoś wpisując Łódź będzie szukał Gorzuchowa Kłodzkiego.

hitherto - @grad: może dałoby się rozróżniać litery o/ó i z/ź ? Raczej nikła szansa ż... — **źródło:** comment_16449453931dy7FN4XVkykae2VoUFu7n.jpg
Pobierz

grad

Yahto

15.02.2022, 17:20:04

@grad: Gościu... Miałem identyczny pomysł xD

grad

fancywire

15.02.2022, 17:24:56

@grad: a czy strona uwzględnia przyczynę opóźnień jako inne pociągi opóźnione przecinające trasę albo odjeżdżające z miast wojewódzkich? Bo predykcja opóźnień na podstawie opóźnień to ślepa uliczka, tu trzeba analizować rzeczy w czasie rzeczywistym

Czerwony_jak_WIG20

15.02.2022, 17:27:28

@grad: dużo nowych funkcji :D Nie funkcjonalności. Funkcjonalne coś jest albo nie jest. Jest funkcjonalne, gdy ma dużo funkcji. Pozdro

grad

grad

15.02.2022, 17:28:38

@optymistycznypesymista: Sprawdzę to. I poprawię jak znajdę przyczynę. Dzięki za info!

Toporky

JaszczompPolownik

15.02.2022, 17:29:52

opakowanie wszystkiego w jak najbardziej przyjazny użytkownikowi UI.

@grad: Na rany Chrystusa, ale weź przy wyszukiwaniu stacji posegreguj to po wielkości miasta. Masz wyżej przykład gdzie po wyszukaniu łodzi nie ma jej nawet w pobliżu pierwszego miejsca.

galwary

15.02.2022, 17:30:49 via iOS

This is pretty damn good!