Mirki muszę jakoś przekonwertować dane.
Mam plik(csv) który zawiera dane numeryczne i symboliczne, przetworzyć mogę tylko dane numeryczne(libsvm).
Jak się do tego zabrać? Wystarczy kazdej wartości symbolicznej nadać jakiś indeks? Czy bawić się z HashingTF, Word2Vec?





























Dementuję ( ͡° ͜ʖ ͡°)
W Javie piszesz swoje klaski do dużej ilości narzędzi. Co do SQLa to przecież używasz go tyrając Hive czy chociażby Sparka (tak, wiem Scala).
@ronin88666: Na chwilę obecną pojawiają się już stanowiska takie jak Big Data Developer/Hadoop Developer Zwykle wymagane na nie jest Java, Scala lub i Python. W praktyce często