Wpis z mikrobloga

Skopiuj link

19.11.2023, 16:37:27

#programista15k #programowanie #chatgpt #sztucznainteligencja

Użytkownik reddita WolframRavenwolf twierdzi, że uzyskał open-sourcowy model, który w benchmarkach plasuje się na poziomie GPT-4, tzn. uzyskuje wyniki podobne do GPT-4. Jest to połączenie (wygląda na to, że zwyczajny merge) dwóch Llam 70b.

Wprawdzie jestem nieco sceptycznie nastawiony do określania modelu "będącym na tym samym poziomie, co GPT-4" tylko na podstawie podobieństwa wyników w testach, ale to i tak imponujące. Co ciekawe, llmy są ponoć dość podatne na mergowanie. Poniżej link do posta i testów:

https://www.reddit.com/r/LocalLLaMA/comments/17vcr9d/llm_comparisontest_2x_34b_yi_dolphin_nous/

LazyInitializationException

19.11.2023, 16:44:05 via Wykop

@JamesJoyce: są już modele 13b które osiągają w benchmarkach 90 kilka procent wyników gpt 4

JamesJoyce

19.11.2023, 16:48:42 via Wykop

13b

@LazyInitializationException: Tak, np Llama-rephraser. Problem ma jednak polegać na tym, że wysokie wyniki w benchmarkach takich modeli mają wynikać nie z architektury modelu, tylko z zanieczyszczenia, którego benchmarki nie wykrywają za dobrze.

https://lmsys.org/blog/2023-11-14-llm-decontaminator/

Aktywne Wpisy

Aktywne Znaleziska

Kontrowersyjne świadczenie finansowe wciąż dostępne. Jak działa renta alkoholowa

Dron z 1989 roku? Tak, EKV (Exoatmospheric Kill Vehicles)

Jak oddamy terminal w Gdyni, to polskie rolnictwo będzie trzymane za gardło

Niemcy likwidują SCT

Niedokończona galeria sztuki

Popularne tagi