Wpis z mikrobloga

Skopiuj link

15.02.2022, 11:34:01

Jakieś dwa lata temu chwaliłem się stworzeniem strony archiwizującej opóźnienia pociągów PKP i generującej proste prognozy opóźnienia na kolejny dzień.

Dziś chwalę się drugi raz, bo zaktualizowałem serwis do wersji 2.0 (na razie w wersji beta). Wersja ta zawiera dużo nowych funkcjonalności, całkowicie nowy UI oraz stworzony od podstaw model machine learning prognozujący opóźnienia pociągów na podstawie szeregu czynników, w tym opóźnień z poprzednich dni, różnych cech pociągu oraz danych pogodowych. Co więcej, model podaje również listę najważniejszych czynników na podstawie których wygenerował daną prognozę (starałem się, aby model był "interpretowalny").

W skrócie, na stronie "Czy pociąg się spóźni?" sprawdzicie:
- historyczne opóźnienia zdecydowanej większości (jeśli nie wszystkich) pociągów krajowych (do 30 dni wstecz)
- aktualne opóźnienia - poglądowo (opóźnione ok. 10-50 min w stosunku do Infopasażera)
- prognozowane opóźnienia - na kolejny kurs pociągu

Serdecznie zapraszam do wypróbowania na https://www.czypociagsiespozni.pl i podzielenie się feedbackiem!

#pkp #pociagi #pociag #chwalesie #sztucznainteligencja #machinelearning #programowanie

grad

15.02.2022, 17:33:08

@JaszczompPolownik: Właśnie na 90% urządzeń jest takie sortowanie, właśnie według wielkości stacji. Na pozostałych 10% zauważyłem, że tez się sortuje, ale zupełnie w druga stronę (najmniejsze na górze). Poszukuję przyczyny błędu i zdecydowanie jedna z rzeczy do naprawy w pierwszej kolejności.

grad

15.02.2022, 17:36:49

@xGreatx: Tak jak wyżej odpisałem, właśnie jest, ale nie działa na wszystkich urządzeniach. Dodawanie opcji do drop-downa odbywa się na poziomie JavaScripta i możliwe, że tutaj potrzeba poprawy. Na pewno sortowanie najpierw według wielkości stacji, a potem alfabetycznie jest jednym z priorytetów na ten moment.

grad

15.02.2022, 17:38:49

@optymistycznypesymista @Solitary_Man: mogę Was poprosić o przesłanie konfiguracji na jakiej występuje ten błąd (jaki OS telefonu + przeglądarka)? Na telefonach na których testowałem było ok, więc będę szukał problemu pod konkretną konfigurację. Może być na priv :)

grad

15.02.2022, 17:40:53

@hitherto: sprawdzę co da się zrobić, na pewno do poprawy jest sortowanie, ale to już tym się zajmuję. Powinno być tak jak na screenie (tak jest na sprzętach na których testowałem do tej pory):

grad - @hitherto: sprawdzę co da się zrobić, na pewno do poprawy jest sortowanie, ale... — **źródło:** comment_1644946850xJbPhh2byCNWt2XPA2kf3v.jpg
Pobierz

hitherto

Urajah

15.02.2022, 17:44:19

@grad: Wyszukiwanie jest nieco denerwujące. Lista powinna być: stacje zaczynające się od ABC; dopiero wtedy stacje zawierające ABC.

Super projekt!

grad

grad

15.02.2022, 17:44:25

@fancywire: ten pomysł jest właśnie w trakcie developmentu. Aktualnie pracuję nad implementacją topografii linii kolejowych, tak aby informacja była dla modelu jak najbardziej wartościowa. Wtedy
predykcje będą w 100% w czasie rzeczywistym. Ciężko powiedzieć kiedy uda mi się to skończyć, ale zdecydowanie to jedna z rzeczy, które chciałbym wdrożyć niedługo.

grad

15.02.2022, 17:45:32

@Urajah: Dzięki za opinię! Zobaczę co da się zrobić, bo do wyszukiwania korzystam z zewnętrznej biblioteki. Zobaczę, co mogę w niej zmienić, żeby działało to tak jak mówisz.

Urajah

grad

15.02.2022, 17:47:19

@ajgoron: Tak jak wspomniałem wyżej. Większość wszystkiego to Python, aplikacja Django, baza Postgres. Wszystko co związane z ML - AWS Sagemaker. Plus kilka usług do instrumentalizacji, analizy logów itp.

grad

15.02.2022, 17:49:14

@FaterAnona: R2 to zły wskaźnik tutaj, gdyż jest to de facto model klasyfikacyjny, który ma wskazać jeden z czterech klas opóźnień. Jako, że klasy są niezbilansowane (ok. 82% pociągów w zbiorze treningowym było opóźnionych 0-4 minut), stosuję tzw. balanced accuracy score czy też balanced F1 score do porównywania jakości modeli.

grad

15.02.2022, 17:51:23

@Yahto: O widzisz, to juz nie musisz go robić :D Tak na serio, jak miałeś jeszcze jakieś inne pomysły, albo niektóre kwestie chciałeś rozwiązać inaczej i chciałbyś się podzielić, to chętnie posłucham!

optymistycznypesymista

15.02.2022, 18:00:08 via Wykop Mobilny (Android)

@grad: wg wykopu nie chcesz odbierać wiadomości prywatnych ode mnie xd
Brave - potężny freez
Chrome - trochę krótszy
Samsung internet - dziala przepięknie.
Tel to galaxy s10+ z androidem 12

grad

Yahto

15.02.2022, 18:00:37

@grad: ja jeszcze myślałem o wizualizacji opóźnień na mapie czyli taka np heatmapa na której widać że na stacji Katowice główne dzisiaj średnio prognozujemy 15 min opóźnienia, albo nie tyle na stacji co na danej trasie np. Katowice - Zwardoń. Oprócz tego alerty na maila/powiadomienia gdy dla danej trasy w danych godzinach pojawia się większe prawdopodobieństwo opóźnienia :-)

Nawiązując do komentarza wyżej. Też miałem zwieche na Brave.

grad

Solitary_Man

15.02.2022, 19:06:24

@grad: realme 7i android 11 chrome

grad

K.....e

konto usunięte 15.02.2022, 20:24:13

@grad: fajnie by było, jakby było to skorelowane z pogodą

grad

15.02.2022, 20:36:49

@KombajnemPrzezUkraine: nie wiem co dokładnie masz na myśli przez słowo skorelowane, ale model wykorzystuje dane pogodowe w tym m.in temperaturę powietrza, temperaturę punktu rosy, prędkość wiatru, opady deszczu i śniegu. Do predykcji brane są pod uwagę prognozy powyższych wartości na kolejny dzień kursu pociągu.

FaterAnona

15.02.2022, 22:07:03

Jako, że klasy są niezbilansowane (ok. 82% pociągów w zbiorze treningowym było opóźnionych 0-4 minut), stosuję tzw. balanced accuracy score czy też balanced F1 score do porównywania jakości modeli

@grad: dlaczego nie zbalansujesz zbiorow?

sesq

15.02.2022, 23:08:13

@optymistycznypesymista: ROC_AUC plx

grad

16.02.2022, 08:22:57

@JaszczompPolownik @hitherto: wyszukiwarka poprawiona, stacje powinny być teraz posortowane od największej na wszystkich przeglądarkach

hitherto

16.02.2022, 08:42:50

@grad: potwierdzam, działa, szybki fix ( ͡° ͜ʖ ͡°)

grad

grad

16.02.2022, 08:53:04

@hitherto: Najważniejsze to słuchać użytkowników ( ͡° ͜ʖ ͡°) Dzięki za potwierdzenie!

Aktywne Wpisy

Adamfabiarz

Adamfabiarz 0

2 godz. i 57 min temu

Hej, proszę o podpowiedzi czy o czymś nie zapomniałem. Mam nowe 20-miesięczne auto. Generalnie głównie to wymieniam w nim olej i filtr oleju (co 7500 - 8500 km lub co pół roku zależy co pierwsze). Auto to benzyna (zagazowana) z wtryskiem pośrednim i bez turbiny, a konkretnie to Fabia Kombi 1.0 MPI 60 KM 2022.

Oprócz oleju są też inne obiekty, którymi trzeba się zająć. Tak więc, co 30 000 km lub