Wpis z mikrobloga

#datascience #machinelearning #nieruchomosci #budownictwo #deweloperka

Wrzucam wynik mojej analizy dotyczącej zmian cen nieruchomości w Polsce, a konkretnie zmiany ceny ofertowej nowych lokali mieszkalnych. Wartość na wykresie jest uśredniona dla wszystkich województw.

Do analizy wykorzystałem dane gusu dotyczące średniej ceny mieszkań, ilości wydanych pozwoleń na budowę, średnich zarobków, danych z NBP o kredytach mieszkaniowych.

Do przygotowania modelu predykcyjnego wykorzystałem biblioteki pandas i darts oraz model BlockRNN.

Projekt robię w ramach treningu do zmiany zawodu na data science w związku z czym zachęcam do zerknięcia w mój kod i zostawienia ewentualnych sugestii lub wyłapania błędów:)

https://github.com/tomczykart/housing-market-prediction

Na koniec zaznaczam, że to tylko przewidywania i nie polecam opierać na tych danych swoich decyzji finansowych.
bonqs - #datascience #machinelearning #nieruchomosci #budownictwo #deweloperka

Wrzuc...

źródło: 8591B42B-6909-468C-B954-6A55BEFE11D6

Pobierz
  • 13
@bonqs: jako data scientis jestes zatrudniony w HRE natomiast jesteś zwolniony z WKP.INFO

Każda analiza danych jaką wykonujesz musisz sobie odpowiedzieć na pytania:
1. Do czego potrzebne?
2. Co ma wyjść?

Wtedy robisz analizę danych. Tutaj widzę, że potrzebne do wyceny cen mieszkań i ma wyjść wzrost w czasie

Na koniec zaznaczam, że to tylko przewidywania i nie polecam opierać na tych danych swoich decyzji finansowych.


@bonqs: grubo poleciałeś. Tutaj
@bonqs: A próbowałeś na przykład na podstawie danych do 2021, połowy 2022 zobaczyć co by wyszło i na wykres wrzucić (albo chociaż dwa koło siebie) co wypluł Twój model a jakie są realne ceny?

Mordo tutaj na podstawie liczby ogłoszeń z OLXa przewiduje się dwucyfrowe spadki cen w ciągu tego roku miła odmiana w końcu ktoś skromny ;)
@cohontes: o! to co mówiłem, zależy co ma wyjść. Tutaj w tym zakresie model musi być nauczony że zawsze spada XD


@Kiedysbedeczerwonka: Nie o to chodzi. Jak budujesz model MLowy to musisz w jakiś sposób próbować badać czy on ma wysoką skuteczność. Inaczej praca jest do dupy. Stąd propozycja @cohontes by próbować go weryfikować na odcinkach.

Niestety w PL mamy bardzo krótki zakres danych, ledwie 20 lat więc trzeba tak