Wpis z mikrobloga

czy ktoś z tagu #programowanie bawił się modelami #word2vec? do tej pory znalazłem tylko przetrenowany model google news, który zjada olbrzymie ilości ramu (za to działa świetnie) oraz korpus 100mb text8 (po przetrenowaniu działa jak uposledzone dziecko). Są jakieś inne ogólnodostępne modele, ew. jakieś pomysły na dobry korpus do nauki? #algorytmy #sztucznainteligencja #python #java #cpp #cplusplus