Wpis z mikrobloga

Skopiuj link

27.09.2024, 12:32:43

GPT-o1 jest przekotem: https://x.com/EpochAIResearch/status/1838720157545648315

Porównanie o1 (jeden prompt) do 4o (wiele promptów, dzielenie zadania na podproblemy, iteracyjne udoskonalanie lub ocenianie wielu wersji odpowiedzi).

4o z systemem udoskonalającym zyskuje góra 5% w GPQA osiągając <55% przy tym samym zużyciu tokenów co o1.

=========

Trzeba mieć na uwadze ograniczenia badania, istnieją potężniejsze systemy rozumowania, oni wykorzystali podstawowe:

4/9 We explored two simple methods to increase token output for GPT-4o: ① Majority voting: choosing the most common answer among k reasoning traces, ② Revisions: giving the model n chances to reflect on and improve its answer

5/9 It's important to note that these are naive approaches. We're aware that more sophisticated methods exist for leveraging inference time compute, such as search against a Process Reward Model verifier. Our goal is to establish a baseline for comparison.

Jeszcze jedno ograniczenie:

10/9 Correction: As @aidanogara points out, our results do not necessarily show that algorithmic improvements explain the difference between o1-preview and GPT-4o. For example, higher quality training data might also explain much of that difference.

=========

#sztucznainteligencja #ai #openai #chatgpt #gpt4

raneli - GPT-o1 jest przekotem: https://x.com/EpochAIResearch/status/1838720157545648... — **źródło:** GYRx2D-akAMs4xB
Pobierz

hub_bub

27.09.2024, 12:43:01 via iOS

@raneli no i super badanie. Pozamyka tych co mówią że o1 to tylko 4o z CoT.

JamesJoyce

29.09.2024, 18:17:22 via iOS

@raneli najlepsze są wykresy, które nie zaczynają się od zera

raneli

29.09.2024, 21:20:22 via Wykop

@JamesJoyce: Ciągle się uczę tego, co może być najbardziej przydatne. Nie jestem pewien, czy dobrze to odczytałem, ale na ten moment wydaje mi się, że coś już wiem. Później najpewniej będę miał inne zdanie. W tym chaosie informacyjnym trudno się poruszać bez solidnej wiedzy opartej na literaturze. Nie powinienem określać, co jest najlepsze dla wszystkich. Mogę jedynie przypuszczać, co w danej chwili może być najlepsze dla mnie.

JamesJoyce

29.09.2024, 21:24:13 via iOS

@raneli to bardzo zdrowe podejście.

Aktywne Wpisy

jmuhha

jmuhha +20

2 godz. i 20 min temu

Wytłumaczy mi skąd takie ceny? U mnie za tazienke
2,7m, korytarz 10 m oraz kuchnie 7m za skucie,
wyszpachlowanie i potozenie ptytek w tazience i w kuchni 217x60 cm oraz potozenie ptytek podtogowych w tych pomieszczeniach.
Panowie policzyto 60 tys. Netto. Dla mnie to jest
absurd. Rozumiem leasing maszyn itp. Ale
przecietny cztowiek po studiach zarabia tyle w rok ( ಠ_ಠ)

jmuhha - Wytłumaczy mi skąd takie ceny? U mnie za tazienke
2,7m, korytarz 10 m oraz k... — **źródło:** 1000009416
Pobierz

Moseva

Moseva +268

1 godz. i 59 min temu

Jestem przekonana że dla tych czerepów, którzy recenzują produkty w internecie od razu po otrzymaniu paczki jest przewidziany specjalny krąg w piekle ᕦ(òóˇ)ᕤ

Choy mnie obchodzi czy paczka szybko doszła i czy opakowanie jest ładne. Pisz dziadu jak działa albo idź się kąpać w soku ze śmieci 🤬

#gorzkiezale #zakupyonline #zakupy

Moseva - Jestem przekonana że dla tych czerepów, którzy recenzują produkty w internec... — **źródło:** IMG_5510
Pobierz

Aktywne Wpisy

Aktywne Znaleziska

Jest nowy świadek i test wykrywaczem kłamstw. Skazany na 25 lat za niewinność?

Głodowe pensje w budżetówce. 3,5k zł "na rękę" za nadzór nad tajnymi dokumentami

Flagowy program PiS "500+" poniósł klęskę. "Wzrost nie nastąpił"

Większość miodu to podróbki. Pszczelarze idą na wojnę z fałszerzami

Mieszkańcy gminy apelują o więcej patroli bo boją się imigrantów

Popularne tagi