Wpis z mikrobloga

Skopiuj link

08.04.2026, 10:18:55

https://red.anthropic.com/2026/mythos-preview/
Przyznajemy już, że punkt AGI dawno za nami i kierujemy się na ASI, czy dalej zakrywamy oczy i udajemy, że AI jest gupie?
#sztucznainteligencja #pracbaza #programowanie

Arkass

08.04.2026, 10:40:22 via Wykop

Przyznajemy już, że punkt AGI dawno za nami i kierujemy się na ASI, czy dalej zakrywamy oczy i udajemy, że AI jest gupie?

@Bejro: IMO:
Popatrzmy jak sobie radzą modele AI w najnowszym teście, którego jedynym zadaniem jest sprawdzenie zdolności wymaganych w AGI, czyli w ARC-AGI-3: https://arcprize.org/leaderboard

Powiedziałbym, że jest całkiem blisko AGI. Jeszcze tylko 99,7%, i już będzie AGI! xD
Zawsze można zakryć oczy, i udawać, że tego testu

Arkass - >Przyznajemy już, że punkt AGI dawno za nami i kierujemy się na ASI, czy dal... — **źródło:** image
Pobierz

elo_kebab

08.04.2026, 11:15:13 via Wykop

@Bejro: a kodowałeś kiedyś z Claude Code? Jeśli nie widzisz w tym AGI to ja nie wiem co nim jest

elo_kebab

08.04.2026, 11:16:16 via Wykop

@Arkass: to tylko jeden z testów, w innym benchmarkach mamy 80-90% spełnionych założeń AGI.

Zresztą żaden człowiek dokładnie nie potrafi zdefiniować czym jest AGI... ale mamy definiować benchmark AGI xDD

MA sens xD

Arkass

08.04.2026, 11:44:20 via Wykop

to tylko jeden z testów, w innym benchmarkach mamy 80-90% spełnionych założeń AGI.

@elo_kebab: IMO:
Nie ma innych benchmarków mierzących tylko i wyłącznie zdolności do bycia AGI niż test ARC-AGI. Gdy pierwsza wersja okazała się błędna i niemierząca jednak AGI, to stworzyli drugą wersję, która też okazała się błędna, przez co stworzyli trzecią wersję.
Zatem nie słyszałem o innym niebłędnym benchmarku mierzącego tylko zdolność do bycia AGI, z wynikiem "80-90%

Arkass - >to tylko jeden z testów, w innym benchmarkach mamy 80-90% spełnionych założ... — **źródło:** image
Pobierz

Bejro

08.04.2026, 12:35:38 via Wykop

@Arkass: Problem z definicją testu AGI jest taki, że w sumie to nie ma ona za bardzo sensu, bo są zadania umysłowe (czysto syntetyczne i abstrakcyjne) gdzie człowiek nie jest w stanie dorównać zwykłemu szympansowi a to jednak człowiek jest powszechnie uważany za inteligentniejszego. AGI-3 posiada limit ruchów który jest głównym czynnikiem limitującym a AI może wykonywać czynności 10-1000 razy szybciej niż człowiek więc ten test celowo faworyzuje ludzi ignorując

Arkass

08.04.2026, 13:10:56 via Wykop

@Bejro: IMO:
Nie wiadomo czy test ARC-AGI-3 jest dobrym testem na umiejętności AGI. Dopiero czas pokaże, czy nowe modele AI będą sobie radzić w realnych zadaniach równie dobrze co w tym teście. Jak w teście modele AI będą mieć co najmniej 80%, a nie będą sobie dobrze radziły w realnych zadaniach w pracy umysłowej (bez nadzoru), to będzie znak, że potrzebny będzie nowy test na AGI, np. nowa wersja tego