Wpis z mikrobloga

#datascience

Cześć potrzebuje pomocy z Clusteryzacja Kmeans w pysparku. Potrzebuje by jedna zmiana z 31 miała większa wage przy tworzeniu klastrów niż inne - w jak sposób to mogę zrobić.

Kmeans=(featurescol=features, k=6, weightCol=???)

Ktoś ma pomysł co tam dać w tym weightCol? Niby wymaga żeby podac string i nie mam pojęcia jak tego użyć. Dodam tylko ze w pysparku zmienne są w vectorze. Każda pomoc się przyda.
  • 4
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach