Też zauważyliście, że Opus 4.6 to pierwszy model który się uczy na bierząco? Wcześniej używałem Gemini 3 flash jako daily i o ile ogarnia sporo to jak uruchamia testy to szuka konkretnego venva na podstawie prób i błędów i tak w kółko przy każdej iteracji, popełnia te same błędy od nowa cały czas. Opus zrozumiał, że blokował się port (zajęło mu to na początku z 5 prób) i zapamiętał ścieżkę do środowiska
@programistabudujacy: W żarciu tokenów. Z mojej obserwacji poziom reasoning jest tylko minimalnie lepszy od Sonneta 4.5 (który był momentami głupszy niż 4.0 - 4.5 potrafił halucynować nawet przy JSONowym inpucie).
@programistabudujacy: W żarciu tokenów. Z mojej obserwacji poziom reasoning jest tylko minimalnie lepszy od Sonneta 4.5 (który był momentami głupszy niż 4.0 - 4.5 potrafił halucynować nawet przy JSONowym inpucie).