Wpis z mikrobloga

#programista15k #programowanie #sztucznainteligencja #filozofia

Ciekawe nowe badanie w którym autorzy przeprowadzili test Turinga współczesnym llmom. Wbrew powszechnemu przekonaniu, żaden z gpt nie przeszedł tego testu.

We evaluated GPT-4 in a public online Turing Test. The best-performing GPT-4 prompt passed in 41% of games, outperforming baselines set by ELIZA (27%) and GPT-3.5 (14%), but falling short of chance and the baseline set by human #!$%@? (63%). #!$%@?' decisions were based mainly on linguistic style (35%) and socio-emotional traits (27%), supporting the idea that intelligence is not sufficient to pass the Turing Test.

https://arxiv.org/abs/2310.20216
  • 13
@MilionoweMultikonto: Myślę że w tych pytaniach brakowało troche kontekstu. Na pewno nie powiedziałbym że nóż leży na stole jeśli pytający stałby przy tym stole, ale w jakiejś innej sytuacji mógłbym tak odpowiedzieć.