Wpis z mikrobloga

@zmarnowany_czas: to jest dość duży skok, patrząc na to, że wzrost nie powinien być liniowy. Trudniej jest przejść z 69.1% na 74.9% niż z 10% na 40%. Dodatkowo patrząc na wydajność o3 i jego cenę za uruchomienie, to jest to przepaść
  • Odpowiedz
@zmarnowany_czas: Zobacz jaki potężny skok GPT 5 zrobił w moim zdaniem jednym z najbardziej uciążliwych elementów, czyli halucynacji. Dla mnie to jest zdecydowanie ważniejsze niż te inne benchmarki, w których i tak jest niezły postęp, bo halucynacje bardzo burzą zaufanie do AI i wprowadzają ludzi w błąd
kkecaj - @zmarnowany_czas: Zobacz jaki potężny skok GPT 5 zrobił w moim zdaniem jedny...

źródło: Gxw98o5bYAED5mR

Pobierz
  • Odpowiedz
@Snowdr0p: @JamesJoyce: spoko, tylko budowali hajp jakby pokonali inne modele z 50 razy, a oni ledwo zrównali się z Claude Opus i chyba nawet są gorsi od Grok 4 Heavy.

I benchmarki to jedno, a realne użycie to drugie. I może widziałem wybiórcze opinie, ale ludzie twierdzą, że 4o i o3 były lepsze
  • Odpowiedz