Wpis z mikrobloga

Skopiuj link

03.08.2024, 13:57:29

#programowanie #programista15k #sztucznainteligencja #chatgpt

Pierwszy raz od premiery ChatuGPT OpenAI nie jest na pierwszym miejscu. Ciekawe, co to znaczy, zwłaszcza, że Sonnet 3,5 także zbliża się do GPT4o.

JamesJoyce - #programowanie #programista15k #sztucznainteligencja #chatgpt

Pierwszy ... — **źródło:** llms
Pobierz

zibizz1

03.08.2024, 16:30:56 via Android

@JamesJoyce to oznacza że GPT-5 coraz bliżej

pa6lo

03.08.2024, 16:33:28 via Wykop

@JamesJoyce Moim zdaniem coraz bardziej widać niedoskonałości metodologii LMSys. Uzmysławia nam, że zaprojektowanie wielostronnego benchmarku dla LLMów jest szalenie trudnym zadaniem.

Gemini na pierwszym miejscu pokazuje, że Google chyba optymalizowało pod konkretne testy. GPT-4o-mini prawie na szczycie? Ten model jest tanim rozwiązaniem dla biznesu i następcą GPT-3.5 turbo.

JamesJoyce

05.08.2024, 19:54:18 via iOS

@pa6lo tak, wydaje mi się, że od dawna już trzeba znaleźć nowy sposób benchmarkowania llmow. Tylko, problemem jest chyba brak jednoznacznej decyzji, w którą stronę pójść. Brakuje jakiegoś nowego wyznacznika jak praca Cholleta nt. pomiarów inteligencji.