Wpis z mikrobloga

Skopiuj link

26.03.2023, 19:52:49

Hej, jeśli śledzicie informacje o kolejnych lmm, to pewnie was to zainteresuje.

Otóż kolejne źródło podaje, że OpenAI mogło testować GPT-4 na danych treningowych, zwłaszcza w aspekcie problemów programistycznych.

Temat ten podejmował wcześniej Horace He, który po wstępnym testowaniu GPT4 odkrył, że model rozwiązuje 10/10 problemów Codeforces sprzed 2021 roku i 0/10 najnowszych problemów (których nigdy wcześniej nie widział).

Tutaj link do threada:

https://twitter.com/cHHillee/status/1635790335535374336

Nowe badania Narayana z Princeton to potwierdzają. Jak piszą:

"Jako kolejny dowód na poparcie tezy prezentowanej przez Horace Ha, przetestowaliśmy GPT-4 na problemach Codeforces z różnych okresów w 2021 roku. Odkryliśmy, że może on regularnie rozwiązywać problemy z łatwej kategorii z przed 5 września, ale żadnych problemów po 12 września".

Koniec trenowania miał miejsce we wrześniu 2021, a więc model nie jest w stanie rozwiązać ani jednego nowego problemu programistycznego.

Dalej piszą oni, jeszcze ciekawsze rzeczy, otóż:

"W rzeczywistości możemy definitywnie pokazać, że model zapamiętał problemy w swoim zbiorze treningowym: po podaniu promptu z tytułem problemu na Codeforces, GPT-4 podaje link do dokładnego konkursu, w którym występuje ten problem".

Łamie to ogólnoprzyjętą zasadę, że nie testuje się na danych treningowych, bo system w taki sposób nie wnioskuje, ale zapamiętuje. Jest to także dość istotne w innych benchmarkach, które model może nie "rozwiązywać za pomocą wnioskowania", ale zwyczajnie wyciągać odpowiedzi z danych treningowych. Autorzy wskazują, że np. proste zmiany w treści pytań w MBA, które są nieistotne dla człowieka, sprawiają że model się gubi, co tylko dowodzi prezentowanej hipotezy.

Tutaj link do threada:

https://twitter.com/random_walker/status/1637929631037927424?s=46&t=m4xgLKFgqFafJXbRTotN1Q&fbclid=IwAR2iWkxaQuvjp7_rR2jdWlxUZYPCgpLgliG0lP5lAFWOwYT5OZ6ycYRZ2no

i artykułu:

https://aisnakeoil.substack.com/p/gpt-4-and-professional-benchmarks

#programowanie #chatgpt #programista15k #sztucznainteligencja

JamesJoyce - Hej, jeśli śledzicie informacje o kolejnych lmm, to pewnie was to zainte... — **źródło:** Zrzut ekranu 2023-03-26 213827
Pobierz

WaveCreator

26.03.2023, 20:10:19 via Wykop

@JamesJoyce: ChatGPT był trenowany na powszechnie dostępnej zawartości internetu, więc trochę nie wiem skąd zdziwienie. Np. prawdopodobnie większość znanych zadań z LeetCode'a, AdventOfCode itp. też rozwiązuje z marszu - bo są one powszechnie dostępne wraz z rozwiązaniami ( ͡° ͜ʖ ͡°)

Na ten moment wygląda na to, że ChatGPT będzie przełomem przede wszystkim w wyszukiwaniu istniejących informacji.

Pytanie brzmi: co się stanie gdy ludzie zaczna masowo tworzyć

6.....D

konto usunięte 26.03.2023, 20:11:54 via Wykop

@JamesJoyce: czyli innymi słowy GPT to genialna wyszukiwarka treści, które ktoś gdzieś już kiedyś utworzył. Nic oryginalnego/nowatorskiego nie wygeneruje.

6.....D

konto usunięte 26.03.2023, 20:16:49 via Wykop

więc trochę nie wiem skąd zdziwienie

@WaveCreator: zdziwienie może wynikać z tego, że firma mająca tak wielu zdolnych inżynierów przeoczyła taki wydawałoby się oczywisty aspekt: że nie testuje się na danych treningowych. Jest też opcja, że wcale tego nie przeoczyli ( ͡° ͜ʖ ͡°)

WaveCreator

26.03.2023, 20:20:27 via Wykop

@638F3D: Nawet obstawiałbym, że nie przeoczyli, ale może trzeba by zapytać ChatGPT... tylko niestety odpowie, że wie tylko o tym co się działo przed październikiem 2021 :(

zobq

26.03.2023, 20:22:13 via Wykop

ChatGPT był trenowany na powszechnie dostępnej zawartości internetu, więc trochę nie wiem skąd zdziwienie.

@WaveCreator: Zdziwieniem jest fakt, że nie było podziału tej zawartości na dane treningowy i sprawdzające. Co by mogło oznaczać, że cały system jest "przetrenowany", ale dzięki temu na jak dużej ilości danych operuje, trudno to wykryć. Przynajmniej tak mógłbym wywnioskować na podstawie mojej miernej wiedzy ze studiów.

co się stanie gdy ludzie zaczna masowo tworzyć treści z

zibizz1

26.03.2023, 20:31:52 via Wykop

@zobq: Wielkie modele są dosć odporne na przetrenowanie. Model nie myśli tylko uzupełnia treść tym co sie nauczył jesli ktoś mu pokazuje zupełnie nową rzecz to nie bedzie jej umiał rozwiązać i to normalne, ale w jakiś sposób uzupełni tekst i to dośc dobrze. Podobnie jak człowiek który nie wie nic na jakiś temat. Nie odpowie poprawnie ale udzieli najlepszej odpowiedzi jaką bedzie w stanie. Model nadal jest rozmyty i nie

kustosz_karuzeli_sperdolenia

26.03.2023, 20:33:38 via Wykop

@zobq: niekoniecznie, możliwe, że zestawy treningowe i testowe były relatywnie zbieżne o co przy dużych zbiorach danych nie trudno, szczególnie biorąc pod uwagę mnogie zbiory rozwiązań problemów programistycznych

Mathouse88

26.03.2023, 20:39:17 via Wykop

Zakładając, że model ciągle będzie "nadganiał" swoją wiedzę przez trening na co raz to nowszych treściach, ciekawe jaki będzie w długim okresie efekt tego, że z czasem coraz częściej będzie trenował na efektach własnej "pracy"?

@WaveCreator: pewnie podobny jak przy "chowie wsobnym" ( ͡° ͜ʖ ͡°)

WaveCreator

zobq

26.03.2023, 20:48:20 via Wykop

Podział na zestaw trenigowy i sprawdzajacy jest żeby sprawdzić jak model jest dobry i czy np nie jest przetrewnowany. Ja nie uwazam żeby tak duży model mógł być przetrenowany.

@zibizz1: Jak już mówiłem, moja wiedza o S.I. jest dosyć zakurzona, ale wydaje mi się, że jeśli dany model umie odpowiadać niemal ze 100% poprawnością na dane wejściowe ze zbioru danych uczących, a jednocześnie ma niemal 0% prawidłowych odpowiedzi na dane wejściowe

PochodnaFunkcji

26.03.2023, 21:18:06 via Wykop

@zobq: Nie musi być przetrenowany. Wystarczy, że pytania były spoza dziedziny w którym się uczył.

Jak trenujemy model żeby rozróżniał koty od psów, nagle mu dajemy cyfry i oczekujemy, że da dobre odpowiedzi no to nie jest on przetrenowany.

Ludzie ciągle nie rozumieją czym że czat GPT to model językowy, a nie do rozwiązywania układów równań czy tym bardziej do rozwiązywania zadań programistycznych.

obieq
konto usunięte
CXLV

zibizz1

26.03.2023, 21:19:36 via Wykop

@zobq: Pod warunkiem że pytanie z poza zbioru jest podobne do tych ze zbioru. Np jeśli trenujesz model na zbiorze:
2+6
2+9
4+6

To jeśli zdasz pytanie
3x8 to oczywiscie że nie bedzie umiał odpowiedzieć
20-6 także ni edzie umiał odpowiedzieć
ale na 6+7 już opdowie że to 13.1 xD bo t opyatnie z dziedziny

Jeszcze raz to napisze. GPT-4 uzupełnia i dostosowuje tekst a nie wnioskuje i rozkminia problemy algorytmiczne

JamesJoyce

26.03.2023, 21:24:26 via Wykop

@WaveCreator: Prawda jest taka, że nie wiemy na czym był trenowany, bo OpenAI postanowiło tego nie podać do wiadomości publicznej. Ktoś podejrzliwy mógłby pomyśleć, że jednym z powodów jest fakt, że np. po sprawdzeniu o co ludzie pytają pierwszą wersję chatagpt (np. o zadania algorytmiczne, fizz-buzzy itd.) dotrenowano GPT4 w odpowiadaniu właśnie na te pytania, żeby jeszcze bardziej napędzić hype.

WH40K

26.03.2023, 21:25:42 via Wykop

co się stanie gdy ludzie zaczna masowo tworzyć treści z pomocą GPT i je publikować,

@WaveCreator: Przypomina mi to trochę czas kiedy masowo powstawały blogi z różnymi dupnymi tekstami od domorosłych dziennikarzy, podróżników, filozofów i bóg wie kogo. Nikt tego nie czytał i umarły śmiercią naturalną.

zobq

26.03.2023, 21:26:24 via Wykop

@PochodnaFunkcji: @zibizz1 chłopaki, czy wy przeczytaliście twitty, do których OP linkował? Bo właśnie o tym mowa. O tej samej kategorii zadań.

Ludzie ciągle nie rozumieją czym że czat GPT to model językowy, a nie do rozwiązywania układów równań czy tym bardziej do rozwiązywania zadań programistycznych.

Jeszcze raz to napisze. GPT-4 uzupełnia i dostosowuje tekst a nie wnioskuje i rozkminia problemy algorytmiczne

Tak, wiem. I umie świetnie dostosować tekst odpowiedzi do pytań,

JamesJoyce

26.03.2023, 21:34:04 via Wykop

@638F3D: generalnie mówi się, że testowanie na danych treningowych to bardziej zapytanie do bazy danych, niż wnioskowanie.

zobq

WaveCreator

26.03.2023, 21:36:45 via Wykop

@JamesJoyce: Niewykluczone. Trzeba pamiętać, że ChatGPT to już nie projekt badawczy, tylko produkt, a Microsoftowi od lat bardzo zależało na tym by na jakimś polu ich wyszukiwarka wyprzedziła Google i przy obecnym zaangażowaniu finansowym można zaryzykować tezę, że OpenAI już dawno przestało być Open ( ͡° ͜ʖ ͡°)

Jedno jest pewne, akcje MS zyskują i będą zyskiwały dalej dopóki OpenAI będzie prezentować kolejne "przełomy" i "nowe wersje",

FLAC

26.03.2023, 21:43:03 via Wykop

Pytanie brzmi: co się stanie gdy ludzie zaczna masowo tworzyć treści z pomocą GPT i je publikować, nie weryfikując wcześniej ich zgodności z prawdą. Zakładając, że model ciągle będzie "nadganiał" swoją wiedzę przez trening na co raz to nowszych treściach, ciekawe jaki będzie w długim okresie efekt tego, że z czasem coraz częściej będzie trenował na efektach własnej "pracy"?

@WaveCreator: model będzie się uczył na danych wygenerowanych przez samego siebie (rękami

cichy-spokojny-grzeczny

26.03.2023, 22:08:54 via Wykop

czyli innymi słowy GPT to genialna wyszukiwarka treści, które ktoś gdzieś już kiedyś utworzył. Nic oryginalnego/nowatorskiego nie wygeneruje.

@638F3D: Generalnie tak. Ale sam fakt, że potrafi np. zestawić dwie informacje i przedstawić to w sposób zupełnie zrozumiały dla człowieka (w postaci spójnie logicznego tekstu) to i tak gigantyczny sukces jego twórców.

Ludzki mózg działa w sumie podobnie, przetwarza bodźce które dostarcza mu otoczenie przez zmysły. Tyle że potrafi je przemielić tak,

konto usunięte
konto usunięte

ziomallox

26.03.2023, 22:19:50 via Wykop

I tak zaraz jakiś troll napisze, że gpt zakończy zapotrzebowanie na programistów xD

bungaBunga

S.....y

konto usunięte 26.03.2023, 22:39:47 via Wykop

Komentarz usunięty przez autora

Aktywne Wpisy

WielkiNos

WielkiNos +143

4 godz. i 8 min temu

Nie wiem po co lewactwo walczy o aborcję jak niedługo tak obrzydzą ludziom seks, że ci go nie będą chcieli w ogóle uprawiać. Okazuje się, że nawet założenie dla faceta bielizny erotycznej, która służy tylko do seksu, bo raczej nikt na co dzień nie chodzi w majtkach z dziurą w kroku, nie jest wyrażeniem zgody na seks. Niedługo ludzie będą podpisywać umowę na stosunek w 2 egzemplarzach po jednym dla każdej ze

WielkiNos

WielkiNos +154

3 godz. i 23 min temu

To zdjęcie przedstawia mężczyznę znajdującego się za barierką mostu w północnej części Londynu. Mężczyzna chciał popełnić samobójstwo jednak w momencie kiedy miał skoczyć zauważyli go przypadkowi przechodnie. Od razu rzucili się na pomoc człowiekowi łapiąc go za nogi, ubranie, głowę. Kilka osób przytrzymywało mężczyznę przez ponad godzinę do czasu przyjazdu pomocy. Spójrzmy na te silne uściski, determinację, współczucie i bezinteresowność ludzkiej pomocy dla całkowicie obcego człowieka.

#samobojstwo #ciekawostki #londyn

WielkiNos - To zdjęcie przedstawia mężczyznę znajdującego się za barierką mostu w pół... — **źródło:** temp_file4268846798483527866
Pobierz

Aktywne Wpisy

Aktywne Znaleziska

Zmodyfikowane Iskandery bardziej odporne na ukraińskie zakłócenia

Palestyński chłopiec zastrzelony. "Tak należy postępować z terrorystami"

TVP wydała 35 mln zł na serwis młodzieżowy. NIK zawiadamia prokuraturę

Dyrektywa wywłaszczeniowa przegłosowana! Budynki 0 emisyjne.

Polio Paul nie żyje. Przez ponad 70 lat żył w żelaznym płucu.

Popularne tagi