Wpis z mikrobloga

Naukowcy ze Stanford opublikowali ciekawy artykuł w którym wskazują, że "emergentnte" własności modeli językowych (czyli takie, które pojawiają się niesopodziewanie, a których nie obserwuje się w mniejszych modelach) znikają po zastosowaniu innego sposobu pomiaru tych zdolności. W praktyce oznacza to, że można wybrać sposób pomiaru, który będzie sugerował że model posiada emergentne zdolności.

https://arxiv.org/pdf/2304.15004.pdf

Cytując:
"Ergo, emergentne zdolności mogą być wytworami wyborów badacza, a nie fundamentalną właściwością rodziny modeli na konkretnym zadaniu".

Czemu takie działanie może służyć? Oczywiście marketingowi. Udawaniu, że modele językowe posiadają "iskry" ogólnej SI (artykuły MS nie da się zreplikować) , lub że emergentnie nauczyły się języka, którego nie ma w danych treningowych (oczywiście był w danych treningowych).

#programowanie #programista15k #datascience #sztucznainteligencja
  • 4