Wpis z mikrobloga

Z nudów (i ciekawości) siadłem sobie dzisiaj i za pomocą jakichś ogólnodostępnych narzędzi do aproksymacji funkcji aproksymowałem funkcję procentowego wzrostu zachorowań z dnia na dzień. Wyszła mi z tego funkcja wykładnicza z czterema parametrami: (P1 * e^(-1 * (X + P2)^2 / (2 * P3^2))) gdzie X to kolejny dzień od przekroczenia 10 przypadków (pominąłem wcześniejsze dni bo przy tak małych liczbach dane nie były wiarygodne). Wklepałem całość w excela, obliczyłem błąd, dodałem wykres rzeczywistej liczby przypadków i aproksymowanej liczby i tak podobierałem parametry żeby błąd był jak najmniejszy a krzywa wzrostu jak najbardziej podobna. Wyszło mi takie coś:

https://docs.google.com/spreadsheets/d/1kKiy4B7A_LUHxA-pblOqSSg4AlgH1Xq4RYzwG0dMn9o/edit?usp=sharing

Według tej funkcji:
- Szczyt nowych zachorowań przypadnie na 09-11 kwietnia z liczbą 338 nowych zachorowań na dzień
- W połowie czerwca osiągniemy wynik 14 tys. zachorowań a wzrost przypadków będzie już nieznaczny (kilka dziennie)

Arkusz można sobie skopiować i samemu podobierać parametry, pewnie komuś uda się dobrać je jeszcze dokładniej. Z czasem prawdopodobnie trzeba też będzie nakładać poprawki na parametry, jeśli rzeczywista krzywa się będzie zmieniać. Co do parametrów to P1 jest mnożnikiem a P2 i P3 odpowiadają za kształt krzywej wzrostu.

#covid19stats #2019ncovstats #koronawirus
  • 30
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@pan-bartolomeu-dias @TakiJedenKtos @dutch-roll @mk321 @zaba34
Nie minął jeszcze tydzień, ale na prośbę @KrolWlosowzNosa zrobiłem podobną aproksymację dla Włoch, z danych z okresu 22.02-13.03 i porównałem aproksymowaną krzywą z rzeczywistymi wynikami z okresu 14.03-31.03. Z początku dane były bardzo zbliżone, z błędem rzędu 3-8%, ale w ostatnich 3 dniach aproksymacja okazała się raczej negatywna, przewidziała wyższe wzrosty niż w rzeczywistości (6-7% w ostatnich 3 dniach, a było
  • Odpowiedz
@KrolWlosowzNosa: A powiem Ci, że właśnie mi szczęka opadła. Wrzuciłem do modelu włoskiego te same parametry co w Polskim, dobrałem tylko wyższy mnożnik który odpowiada za nachylenie krzywej (bo we Włoszech ten wzrost był dużo bardziej gwałtowny), zostawiłem parametry odpowiedzialne za krzywiznę (w niedzielę spędziłem z godzinę na ich dobieraniu, dzisiaj zadowoliłem się jako takim wynikiem po 10 minutach zabawy) i wyszedł wynik dużo bliższy rzeczywistości:

https://docs.google.com/spreadsheets/d/1O3C7pSQ8_C7h8jeytLvRXTP2afzsIsKcJnJxndRCz_M/edit?usp=sharing
  • Odpowiedz
@LiczbaPi: Jakich narzędzi używasz do pomocy, czy w Excelu są takie pomoce. Czy próbowałeś w Excelu linię trendu. Najlepiej podaj w kilku punktach w skrócie jak to robisz. Załóż w swoich danych 4096 na 5/4 oraz 8192 przypadków na 12/4, bo to całkiem realne, i wtedy zobacz co ostatecznie wyjdzie. Co spowoduje takie dość szybkie wypłaszczenie krzywej jak na wykresie, który podałeś.

https://www.wykop.pl/wpis/48415915/prognoza-koronawirus-31-03-2020-x2-16-gt-32-gt-64-/
  • Odpowiedz
@pan-bartolomeu-dias @TakiJedenKtos @dutch-roll @mk321 @zaba34
Miałem wołać wczoraj, ale jak pewnie wiecie ostatnie dni przyniosły tak rozstrzelane wyniki, że ciężko coś konkretnego na ich podstawie wnioskować. Po części jest to pewnie spowodowane zwiększoną ilością testów, po części zmianą częstotliwości raportowania, a po części burdelem - ponoć wiele zależy od tego o której wojewódzkie stacje wyślą raporty, wystarczy spóźnienie z ostatnim i już dane będą zaliczone na poczet
  • Odpowiedz
@dutch-roll: Poza tym, że dodałem więcej metryk to nie, w pewnym momencie aproksymowałem funkcję od nowa, ale to była jakaś tymczasowa anomalia, więc ostatecznie wróciłem do oryginalnej aproksymacji i jak na razie błąd jest bardzo mały. Zobaczymy co przyniosą następne dni, bo znowu trochę zaczynają mi się wykresy rozbiegać, ale nie będę tego zmieniał jeśli nie rozbiegną się jakoś znacząco.

Rozszerzona wersja wykresów: https://docs.google.com/spreadsheets/d/1atXyGeF97w-qQsSKhcg2BwI0zFpBnuGvLvl_H9_jGsM/edit?usp=sharing
  • Odpowiedz