ChatGPT 5 już jest. Więcej myśli i mniej kłamie

Największy nacisk położono na redukcję halucynacji i poprawę jakości w trzech obszarach. Chodzi o pisanie, programowanie oraz tematy zdrowotne.
- #
- #
- #
- #
- #
- #
- 2
- Odpowiedz

Największy nacisk położono na redukcję halucynacji i poprawę jakości w trzech obszarach. Chodzi o pisanie, programowanie oraz tematy zdrowotne.
Komentarze (2)
najlepsze
Programistą nie jestem, ale widziałem już benchmarki.
Dla mnie najważniejszym benchmarkiem jest taki, który sprawdza ogólne umiejętności modelu, czyli procent do osiągnięcia AGI. Na ten moment najlepszym takim benchmarkiem jest ten: https://arcprize.org/leaderboard
I tam zakładka: ARC-AGI-2, gdzie GPT-5 uzyskuje 10% (o3 miał 6%), gdzie Grok 3 Thinking