Wpis z mikrobloga

@zametr: w końcu zamiast biadolenia że potrzebne AI, ktoś zaglądnął w książkę do statystyki.
Ciekawe jaki kolejny myk opracują koneserzy betonowego złota
  • Odpowiedz
  • 4
@Fredi_Kamionka_Gmina_Burzenin: póki co daliśmy info o zmianie liczenie średniej w nagłówku.

Do czasu przeliczenia danych (1-2 miechy) będzie informacja pod wykresem w przypadku średniej, bo medianę mierzymy niezmiennie od 3 lat, tylko nigdy jej nie prezentowaliśmy.
  • Odpowiedz
@zametr Można jeszcze użyć jakiegoś modelu statystycznego zamiast obcinać na sztywno, np. isolation forest, wtedy to już w ogóle te dane byłyby odporne na jakąkolwiek manipulacje. Nie wiem w czym tam to piszecie ale w pythonie scikit ma fajne implementacje takich rzeczy. W node też jest ml-isolation-forest. Nawet łatwiej tego użyć niż obcinać 2%. Przy 100mln próbek to będzie 20 min liczenia w pythonie.
  • Odpowiedz
  • 4
@Czekolatka:

Przy 100mln próbek to będzie 20 min liczenia w pythonie.

ILE!?!

Dzięki, ale myślę, że nie ma potrzeby używać tak skomplikowanego algorytmu. Pole do manipulacji przy ścinaniu 2,0% i medianie są i tak już mocno ograniczone. Poza tym wydaje mi się, że ten algorytm dalej przepuszczałby ceny za m2, które mieszczą się w górnych kilku procentach rozkładu, tzn. umożliwiałby sztuczne podnoszenie średniej.
  • Odpowiedz
Dzięki, ale myślę, że nie ma potrzeby używać tak skomplikowanego algorytmu


@zametr: a ja myślę, że warto spróbować. Nawet jeśli nie na stronie, to możecie wrzucać takie analizy z wykorzystaniem alternatywnych algorytmów na X.
  • Odpowiedz