Wpis z mikrobloga

Przyznajemy już, że punkt AGI dawno za nami i kierujemy się na ASI, czy dalej zakrywamy oczy i udajemy, że AI jest gupie?


@Bejro: IMO:
Popatrzmy jak sobie radzą modele AI w najnowszym teście, którego jedynym zadaniem jest sprawdzenie zdolności wymaganych w AGI, czyli w ARC-AGI-3: https://arcprize.org/leaderboard

Powiedziałbym, że jest całkiem blisko AGI. Jeszcze tylko 99,7%, i już będzie AGI! xD
Zawsze można zakryć oczy, i udawać, że tego testu
Arkass - >Przyznajemy już, że punkt AGI dawno za nami i kierujemy się na ASI, czy dal...

źródło: image

Pobierz
  • Odpowiedz
@Arkass: to tylko jeden z testów, w innym benchmarkach mamy 80-90% spełnionych założeń AGI.

Zresztą żaden człowiek dokładnie nie potrafi zdefiniować czym jest AGI... ale mamy definiować benchmark AGI xDD

MA sens xD
  • Odpowiedz
to tylko jeden z testów, w innym benchmarkach mamy 80-90% spełnionych założeń AGI.


@elo_kebab: IMO:
Nie ma innych benchmarków mierzących tylko i wyłącznie zdolności do bycia AGI niż test ARC-AGI. Gdy pierwsza wersja okazała się błędna i niemierząca jednak AGI, to stworzyli drugą wersję, która też okazała się błędna, przez co stworzyli trzecią wersję.
Zatem nie słyszałem o innym niebłędnym benchmarku mierzącego tylko zdolność do bycia AGI, z wynikiem "80-90%
Arkass - >to tylko jeden z testów, w innym benchmarkach mamy 80-90% spełnionych założ...

źródło: image

Pobierz
  • Odpowiedz
  • 0
@Arkass: Problem z definicją testu AGI jest taki, że w sumie to nie ma ona za bardzo sensu, bo są zadania umysłowe (czysto syntetyczne i abstrakcyjne) gdzie człowiek nie jest w stanie dorównać zwykłemu szympansowi a to jednak człowiek jest powszechnie uważany za inteligentniejszego. AGI-3 posiada limit ruchów który jest głównym czynnikiem limitującym a AI może wykonywać czynności 10-1000 razy szybciej niż człowiek więc ten test celowo faworyzuje ludzi ignorując
Bejro - @Arkass: Problem z definicją testu AGI jest taki, że w sumie to nie ma ona za...

źródło: Screenshot 2026-04-08 at 14.33.01

Pobierz
  • Odpowiedz
@Bejro: IMO:
Nie wiadomo czy test ARC-AGI-3 jest dobrym testem na umiejętności AGI. Dopiero czas pokaże, czy nowe modele AI będą sobie radzić w realnych zadaniach równie dobrze co w tym teście. Jak w teście modele AI będą mieć co najmniej 80%, a nie będą sobie dobrze radziły w realnych zadaniach w pracy umysłowej (bez nadzoru), to będzie znak, że potrzebny będzie nowy test na AGI, np. nowa wersja tego
  • Odpowiedz