Cześć potrzebuje pomocy z Clusteryzacja Kmeans w pysparku. Potrzebuje by jedna zmiana z 31 miała większa wage przy tworzeniu klastrów niż inne - w jak sposób to mogę zrobić.
Kmeans=(featurescol=features, k=6, weightCol=???)
Ktoś ma pomysł co tam dać w tym weightCol? Niby wymaga żeby podac string i nie mam pojęcia jak tego użyć. Dodam tylko ze w pysparku zmienne są w vectorze. Każda pomoc się przyda.
10 lat temu Rosjanie mieli jeszcze pozytywny stosunek do Polaków i tutaj nawet nazwali Polaka bratem. Później wszystko się zepsuło przez politykę zachodu względem Ukrainy. #wojna #ukraina #rosja #polska #polityka
Cześć potrzebuje pomocy z Clusteryzacja Kmeans w pysparku. Potrzebuje by jedna zmiana z 31 miała większa wage przy tworzeniu klastrów niż inne - w jak sposób to mogę zrobić.
Kmeans=(featurescol=features, k=6, weightCol=???)
Ktoś ma pomysł co tam dać w tym weightCol? Niby wymaga żeby podac string i nie mam pojęcia jak tego użyć. Dodam tylko ze w pysparku zmienne są w vectorze. Każda pomoc się przyda.
https://danvatterott.com/blog/2019/11/18/balancing-model-weights-in-pyspark/