Wpis z mikrobloga

#datascience #machinelearning #nieruchomosci #budownictwo #deweloperka

Wrzucam wynik mojej analizy dotyczącej zmian cen nieruchomości w Polsce, a konkretnie zmiany ceny ofertowej nowych lokali mieszkalnych. Wartość na wykresie jest uśredniona dla wszystkich województw.

Do analizy wykorzystałem dane gusu dotyczące średniej ceny mieszkań, ilości wydanych pozwoleń na budowę, średnich zarobków, danych z NBP o kredytach mieszkaniowych.

Do przygotowania modelu predykcyjnego wykorzystałem biblioteki pandas i darts oraz model BlockRNN.

Projekt robię w ramach treningu do zmiany zawodu na data science w związku z czym zachęcam do zerknięcia w mój kod i zostawienia ewentualnych sugestii lub wyłapania błędów:)

https://github.com/tomczykart/housing-market-prediction

Na koniec zaznaczam, że to tylko przewidywania i nie polecam opierać na tych danych swoich decyzji finansowych.
bonqs - #datascience #machinelearning #nieruchomosci #budownictwo #deweloperka

Wrzuc...

źródło: 8591B42B-6909-468C-B954-6A55BEFE11D6

Pobierz
  • 13
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 2
@Kiedysbedeczerwonka: dodałem tagi z nieruchomości jako ciekawostka dla ludzi.
Nie pracuje jeszcze jako data scientist i nie zakładałem co ma wyjść z analizy, tj. jak będą się zachowywać ceny.

@cohontes
Już upubliczniłem githaba. Ewaluacja modelu jeszcze przede mną. Na razie na szybko wrzuciłem co wychodzi.
  • Odpowiedz
@bonqs: A próbowałeś na przykład na podstawie danych do 2021, połowy 2022 zobaczyć co by wyszło i na wykres wrzucić (albo chociaż dwa koło siebie) co wypluł Twój model a jakie są realne ceny?

Mordo tutaj na podstawie liczby ogłoszeń z OLXa przewiduje się dwucyfrowe spadki cen w ciągu tego roku miła odmiana w końcu ktoś skromny ;)
  • Odpowiedz
@cohontes: o! to co mówiłem, zależy co ma wyjść. Tutaj w tym zakresie model musi być nauczony że zawsze spada XD


@Kiedysbedeczerwonka: Nie o to chodzi. Jak budujesz model MLowy to musisz w jakiś sposób próbować badać czy on ma wysoką skuteczność. Inaczej praca jest do d--y. Stąd propozycja @cohontes by próbować go weryfikować na odcinkach.

Niestety w PL mamy bardzo krótki zakres danych, ledwie 20 lat
  • Odpowiedz