Wpis z mikrobloga

#programista15k #programowanie #sztucznainteligencja #filozofia

Ciekawe nowe badanie w którym autorzy przeprowadzili test Turinga współczesnym llmom. Wbrew powszechnemu przekonaniu, żaden z gpt nie przeszedł tego testu.

We evaluated GPT-4 in a public online Turing Test. The best-performing GPT-4 prompt passed in 41% of games, outperforming baselines set by ELIZA (27%) and GPT-3.5 (14%), but falling short of chance and the baseline set by human participants (63%). Participants' decisions were based mainly on linguistic style (35%) and socio-emotional traits (27%), supporting the idea that intelligence is not sufficient to pass the Turing Test.

https://arxiv.org/abs/2310.20216
  • 13
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@MilionoweMultikonto: Myślę że w tych pytaniach brakowało troche kontekstu. Na pewno nie powiedziałbym że nóż leży na stole jeśli pytający stałby przy tym stole, ale w jakiejś innej sytuacji mógłbym tak odpowiedzieć.
  • Odpowiedz
@zibizz1: albo i nie bo już trąbią o ograniczeniach. To jak z prockami, które co parę lat podwajały moc, a obecnie masz po 5% przyrostu
  • Odpowiedz