Przyznajemy już, że punkt AGI dawno za nami i kierujemy się na ASI, czy dalej zakrywamy oczy i udajemy, że AI jest gupie?
@Bejro: IMO: Popatrzmy jak sobie radzą modele AI w najnowszym teście, którego jedynym zadaniem jest sprawdzenie zdolności wymaganych w AGI, czyli w ARC-AGI-3: https://arcprize.org/leaderboard
Powiedziałbym, że jest całkiem blisko AGI. Jeszcze tylko 99,7%, i już będzie AGI! xD Zawsze można zakryć oczy, i udawać, że tego testu
to tylko jeden z testów, w innym benchmarkach mamy 80-90% spełnionych założeń AGI.
@elo_kebab: IMO: Nie ma innych benchmarków mierzących tylko i wyłącznie zdolności do bycia AGI niż test ARC-AGI. Gdy pierwsza wersja okazała się błędna i niemierząca jednak AGI, to stworzyli drugą wersję, która też okazała się błędna, przez co stworzyli trzecią wersję. Zatem nie słyszałem o innym niebłędnym benchmarku mierzącego tylko zdolność do bycia AGI, z wynikiem "80-90%
@Arkass: Problem z definicją testu AGI jest taki, że w sumie to nie ma ona za bardzo sensu, bo są zadania umysłowe (czysto syntetyczne i abstrakcyjne) gdzie człowiek nie jest w stanie dorównać zwykłemu szympansowi a to jednak człowiek jest powszechnie uważany za inteligentniejszego. AGI-3 posiada limit ruchów który jest głównym czynnikiem limitującym a AI może wykonywać czynności 10-1000 razy szybciej niż człowiek więc ten test celowo faworyzuje ludzi ignorując
@Bejro: IMO: Nie wiadomo czy test ARC-AGI-3 jest dobrym testem na umiejętności AGI. Dopiero czas pokaże, czy nowe modele AI będą sobie radzić w realnych zadaniach równie dobrze co w tym teście. Jak w teście modele AI będą mieć co najmniej 80%, a nie będą sobie dobrze radziły w realnych zadaniach w pracy umysłowej (bez nadzoru), to będzie znak, że potrzebny będzie nowy test na AGI, np. nowa wersja tego
Przyznajemy już, że punkt AGI dawno za nami i kierujemy się na ASI, czy dalej zakrywamy oczy i udajemy, że AI jest gupie?
#sztucznainteligencja #pracbaza #programowanie
@Bejro: IMO:
Popatrzmy jak sobie radzą modele AI w najnowszym teście, którego jedynym zadaniem jest sprawdzenie zdolności wymaganych w AGI, czyli w ARC-AGI-3: https://arcprize.org/leaderboard
Powiedziałbym, że jest całkiem blisko AGI. Jeszcze tylko 99,7%, i już będzie AGI! xD
Zawsze można zakryć oczy, i udawać, że tego testu
źródło: image
PobierzZresztą żaden człowiek dokładnie nie potrafi zdefiniować czym jest AGI... ale mamy definiować benchmark AGI xDD
MA sens xD
@elo_kebab: IMO:
Nie ma innych benchmarków mierzących tylko i wyłącznie zdolności do bycia AGI niż test ARC-AGI. Gdy pierwsza wersja okazała się błędna i niemierząca jednak AGI, to stworzyli drugą wersję, która też okazała się błędna, przez co stworzyli trzecią wersję.
Zatem nie słyszałem o innym niebłędnym benchmarku mierzącego tylko zdolność do bycia AGI, z wynikiem "80-90%
źródło: image
Pobierzźródło: Screenshot 2026-04-08 at 14.33.01
PobierzNie wiadomo czy test ARC-AGI-3 jest dobrym testem na umiejętności AGI. Dopiero czas pokaże, czy nowe modele AI będą sobie radzić w realnych zadaniach równie dobrze co w tym teście. Jak w teście modele AI będą mieć co najmniej 80%, a nie będą sobie dobrze radziły w realnych zadaniach w pracy umysłowej (bez nadzoru), to będzie znak, że potrzebny będzie nowy test na AGI, np. nowa wersja tego