Osiem miesięcy temu Bartosz Naskręcki (prodziekan Wydziału Matematyki i Informatyki Uniwersytetu Adama Mickiewicza w Poznaniu) wyraził się w sposób następujący: sztuczna inteligencja to nic więcej niż bardzo zaawansowany kalkulator. Potrafiła liczyć, ale nie rozumiała głębokiej matematyki. Prawdziwe rozumowanie matematyczne, jak powiedział, wymaga „kreatywności, intuicji i umiejętności łączenia pozornie niepowiązanych pojęć, czego maszyny wciąż nie potrafią”.
A 2 tyg. temu:
W






![Przedstawiamy: Copilot Health [EN]](https://wykop.pl/cdn/c3397993/5326b90f0c246fe46e3ec557e491016f51c9e949ff6b40858b61beab064ed2f2,w220h142.jpg)

![Sabine: "Hipoteza symulacji zyskuje naukowe poparcie" [EN]](https://wykop.pl/cdn/c3397993/e6af63e6b127401fd2452cafa70542b1a1cc991928c8aee803bd598fb56022f9,w220h142.jpg)

![Evo 2 model AI języka DNA - w pełni otwarty, włączając w to parametry i kod.[EN]](https://wykop.pl/cdn/c3397993/9b0ab82886e0160bc20138bf3e6a7fb3db83d5dd18ee5201869de829ca28d307,w220h142.jpg)



![Przedstawiamy Nano Banana 2 (Gemini 3.1 Flash Image) [EN]](https://wykop.pl/cdn/c3397993/b4c57024e8b5b302b53e627370f53dfeff11b2dc01b05d3a166f321add9b377c,w220h142.png)










https://arcprize.org/leaderboard
Pierwsze wyniki są zgoła inne od wersji 1 i 2:
Grok 4.2: 0%
Claude Opus 4.6 i Gemini 3.1 Pro: 0.2%
GPT-5.4: 0.3%
źródło: image
PobierzTakich gier (environments) jest ponoć 150+, z 1000+ planszami (poziomami): https://x.com/AiBattle_/status/2036463278151377023
Metodologia testu: https://arcprize.org/blog/arc-agi-3-preview-30-day-learnings
Czy to doprowadzi do AGI jeżeli skala takich zadań będzie duża i różnorodna? Czy przy przypadkiem my ludzie nie uczymy się dokładnie tak samo - w szkole uczymy rozwiązywać się różnego typu zadania