Wpis z mikrobloga

Skopiuj link

Czy magiczny prompt z reddita faktycznie sprawia, że Claude 3.5 (Sonnet) jest w stanie pokonać o1-preview?
No nie. Ale zauważalnie poprawia rozumowanie Claude'a.

#sztucznainteligencja #claude #ai

TL;DR:

🧠 Combines Dynamic Chain of thoughts + reflection + verbal reinforcement prompting

📊 Benchmarked against tough academic tests (JEE Advanced, UPSC, IMO, Putnam)

🏆 Claude 3.5 Sonnet outperformes GPT-4 and matched O1 models

🔍 LLMs can create internal simulations and take 50+ reasoning steps for complex problems

📚 Works for smaller, open models like Llama 3.1 8B +10% (Llama 3.1 8B 33/48 vs GPT-4o 36/48)

❌ Didn’t benchmark like MMLU, MMLU pro, or GPQA due to computing and budget constraints

📈 High token usage - Claude Sonnet 3.5 used around 1 million tokens for just 7 questions

https://x.com/_philschmid/status/1842846050320544016

PeterWeiss - Czy magiczny prompt z reddita faktycznie sprawia, że Claude 3.5 (Sonnet)... — **źródło:** GZL3o-qaoAAquYL
Pobierz

PeterWeiss

przedwczoraj, 14:28:36 via Wykop

Blog: https://medium.com/@harishhacker3010/can-we-make-any-smaller-opensource-ai-models-smarter-than-human-1ea507e644a0

Prompt: https://gist.github.com/philschmid/34747bf5bc8280f3a5f10f5fd8d1cd4b

Github: https://github.com/harishsg993010/LLM-Research-Scripts

PeterWeiss

przedwczoraj, 14:31:47 via Wykop

Dla ludzi bez X:
https://threadreaderapp.com/thread/1843014880846356809.html

Z151

przedwczoraj, 16:54:53 via Wykop

@PeterWeiss: good stuff ( ͡° ͜ʖ ͡°)

coiber

wczoraj, 10:24:52 via Wykop

@PeterWeiss: mam darmowe konto i wyczerpało się na, chyba, 2 kroku; przepis na hawajską :)

Nasz przewodnik po pizzy hawajskiej przeszedł imponującą ewolucję od prostego przepisu do kompleksowego, wieloaspektowego źródła wiedzy. W trakcie jego tworzenia udało nam się:

Opracować solidny przepis podstawowy z licznymi wariantami
Przedstawić różne

PeterWeiss

wczoraj, 11:43:30 via Wykop

@coiber: Najs :D
Ano, koszt tego prompta jest ogromny, a darmowy Claude też nie jest zbyt szczodry w obdarowywaniu tokenami.

Claude Sonnet 3.5 used around 1 million tokens for just 7 questions

Aktywne Wpisy

Lewusx

Lewusx +112

4 godz. i 27 min temu

Dużo pytań o to czy da się kupić spodnie na takie uda?
Da się.
Pytania czy jest powodzenie u kobiet?
Jest.
Czy wyglądam jak monstrum na codzień?
Chyba nie.

Lewusx - Dużo pytań o to czy da się kupić spodnie na takie uda?
Da się.
Pytania czy ... — **źródło:** BF7AA6FC-B8E4-41CF-A1FB-2DD4C55F5DC7
Pobierz

Czy kulturystyka to kalectwo?

Tak. 36.0% (578)
Tak i to jak. 64.0% (1027)

EnzoMolinari

EnzoMolinari +40

4 godz. i 42 min temu

Nowa funkcjonalność w Volkswagenie. Powinni wprowadzić to od razu seryjnie do wszystkich aut wszytkich producentów. I tak nie może wydarzyć się nic gorszego niż jeździec bez głowy na autostradzie.

#samochody #motoryzacja #ciekawostki

EnzoMolinari - Nowa funkcjonalność w Volkswagenie. Powinni wprowadzić to od razu sery...

Aktywne Wpisy

Czy kulturystyka to kalectwo?

Aktywne Znaleziska

Zakaz na hulajnogi elektryczne. Jedno miasto powiedziało stanowcze "nie"

Pilot źle się poczuł. Pasażer przejął stery w samolocie

Gang trucicieli w Warszawie. Szokujące metody działania

Niecodzienna pobłażliwość Policji

Szczecińska patologia atakuje kierowce z Ukrainy. Pomóżmy odnaleźć sprawców

Popularne tagi