Wpis z mikrobloga

Skopiuj link

konto usunięte 01.03.2024, 21:05:30

Powazne pytanie do apologetow teorii dot. AGI, jakie metody matematyczne mialyby stac za potencjalnym AGI? Jak to widzicie od strony fundamentalnej? #ai #programista15k #informatyka #matematyka

zibizz1

01.03.2024, 22:18:08 via Android

@ElMatadore to co dziś tylko bardziej. Zarówno ważna jest algebra czyli wektory i macierze wielowymiarowe, analiza aby przyspieszac obliczenia poprzez analityczne pochodne zapewniające efektywne uczenia, algorytmy zapewniające stabilność kilkudziesięciu warstwowych sieci( a w przyszłości tysięcy) i eksperymentalne tworzenie nowych architektur

Ale żeby dojść do AGI potrzeba jeszcze 2 rzeczy
1. Prostsza sprzętowa implementacja operacji mnożenia i dodawaniu, przez opór, napięcie i natężenie
2. Sprzętowa implementacja architektury (po udanym uczeniu można produkować

E.....e

konto usunięte 02.03.2024, 00:01:10 via Wykop

@zibizz1: to dalej musialoby operowac w obszarze LLMow ktore sa ograniczone do przetwarzania jezyka naturalnego. LLMy moga byc co najwyzej skladowa takiegoz AGI. To co mowisz to sprowadza sie do zwiekszenia mocy przerobowych i ilosci danych modeli, ale one caly czas beda w naturalny sposob ograniczone aparatem matematycznym. Prove me wrong

zibizz1

02.03.2024, 00:17:14 via Android

@ElMatadore to będzie na pewno wielka sieć neuronowa. Język wyjdzie naturalnie bo wsadem będzie tekst, audio oraz video. Na wyjściu sam nie wiem ale pewnie tekst, może też jakiej na video/audio, self-attenion w buforze, żeby skompresować i wrzucić np ostatnie 10-60 minut takiego strumienia danych to trzeba naprawdę dużo mocy

ZdeformowanyKreciRyj

02.03.2024, 00:19:14 via Wykop

ale one caly czas beda w naturalny sposob ograniczone aparatem matematycznym

@ElMatadore: Czemu problemu doszukujesz się akurat w aparacie matematycznym? Mając dostatecznie mocny model obliczeniowych pod względem siły wyrazu jak i wydajności moglibyśmy zasymulować realny mózg a nie to co teraz. Nie ma jakichś większych powodów żeby to miało nie zadziałać bo i aktualnie nie ma powodów dla których duże modele miałyby być jakkolwiek ograniczone, przecież mamy twierdzenia o uniwersalnej

JamesJoyce

02.03.2024, 10:16:23 via iOS

@zibizz1 w jaki sposób sieć neuronowa stworzy model świata? Jak oduczy się halucynować? Jak uzyska realną multimedialność? Jak nauczy się interakcji ze światem fizycznym? Takich pytań jest znacznie więcej.

Pamiętaj, że ludzie uczą się z bardzo małej liczby przykładów. Sieć neuronowa jest tego przeciwieństwem. Potrzebuje ona wielkiej ilości danych. Ale nawet mimo posiadania ich, obecne architektury są opakowaną w hajp funkcją przewidywania następnego słowa/pasującego obrazu. Niczym więcej, niczym mniej.

Co do

E.....e

konto usunięte 02.03.2024, 11:21:01 via Wykop

@zibizz1: @ZdeformowanyKreciRyj potezne LLMy to mamy tu i teraz i jak widac te modele sa uzyteczne, ale jak kazdy model - bledne. One nie beda sie stawac jakies znaczaco lepsze w tym co teraz robia, a same np. LLMy sa ograniczone do interpretacji tekstu czytanego, nie potrafia myslec jak czlowiek tylko aproksymuja twierdzenie na bazie inputu, bez wiekszego wnioskowania logicznego. Jakie konkretnie modele moglyby wiec sluzyc do suplementacji potencjalnego

zibizz1

02.03.2024, 13:28:18 via Android

@ElMatadore obecnie wnioskowanie tworzy się tak że to co sieć wyprodukowała (tokeny wygenerowane przez model) staje się wejściem do tego aby wygenerować kolejny token. Takich sprzężeń musi być więcej. Czyli jeśli poprosisz o przygotowanie prezentacji to najpierw powinien powstać plan/spis treści a potem uzupełniają punkty treścią. Najpierw szukasz informacji a potem tworzysz prezentację. I właśnie żeby takie coś zachodzilo potrzeba jakieś nowej architektury.

@JamesJoyce model nie halucynuje tylko konfabuluje, zdarza się to jak mamy dziury i automatycznie uzupełniane jest to najprawdopodobniejsza treścią jak unludzi. Ludzie nie uczą się po bardzo małej ilości przykładów. Sama nauka chodzenia to ok rok nauki po kilka godzin dziennie. Wielka sieć neuronowa ma już bardzo dobrze wykształcone odpowiednie rejony do odpowiednich celów, wykształcają się pośrednie wartości sygnałów które reprezentują pewną cechę danych która służyć może do nowych wyzwań. Wykorzystuje się to w fine-tuningu w którym nie trzeba już tak dużo danychy nauczyć się czegoś nowego.

To trochę tak jak uczenie niemowlaka działań matematycznych, też potrzebujesz wtedy ogromnych ilości przykładów ale gdy masz już do czynienia z wykształconym człowiekiem to bazując na tym co potrafi szybciej jest w stanie się czegoś nowego nauczyć, bo już dużo więcej

JamesJoyce

02.03.2024, 16:30:42 via Wykop

@zibizz1: Uczenie się chodzenia nie ma wiele wspólnego z uczeniem się języka.

nie trzeba już tak dużo danychy nauczyć się czegoś nowego

Ale czego nowego? Jak działa świat? Dlaczego jak przełożymy długopis z jednej części blatu na drugi to dzieje się x,y,x czy jednak nowego, w rozumieniu: znam 20 marek samochodów, a dzięki finetuningu poznam kolejne 10 na podstawie wiedzy, którą już posiadam? Bo chyba jednak to

zibizz1

02.03.2024, 17:30:31 via Android

@JamesJoyce no właśnie chodzi o to że odpowiednio duża sieć neuronowa rozumie. Na pierwszych warstwach potrafi ocenić słowa Pitagoras, trójkąt, prostopadły, kąt potem całe zdania i wzbudzić w kolejnych warstwach rejony odpowiedzialne za rozumienie tego twierdzenia i zastosować je w danym przykładzie.

Jeśli wprowadzasz coś nowego to w niewytrenowanej sieci musisz zmodyfikować kilkadziesiąt warstw, natomiast w wytrenowane sieci wystarczy istotne zmiany wystarczy wprowadzić gdzieś w środku, jeśli gradient jest znormalizowany to

JamesJoyce

02.03.2024, 21:52:15 via iOS

@zibizz1 podaj dowody na to, że sieć neuronowa rozumie cokolwiek. Najlepiej w postaci artykułów opublikowanych w recenzowanych czasopismach.

Nie twierdzę, że to magia. Trenuje sieci neuronowe od lat i wiem jak działają. Gpt4 nie rozumie kompletnie nic.

zibizz1

02.03.2024, 23:13:14 via Android

@JamesJoyce sieć neuronowa na podstawie ogromnego zbioru danych potrafi ocenić kontekst słów tekstu wsadowego, przeanalizować to i generować tekst który jest zgodny z wiedza zawarta w danych treningowych. Nie ma żadnych publikacji które nazwały by to świadomym rozumieniem bo taki LLM bezmyślnie dokłada kolejne najbardziej pasujące słowo. Nie ma czegoś takiego jak myślenie przyczynowo skutkowe czy wnioskowanie. To tylko generowanie tekstu na podstawie wzorców odkrytych w danych treningowych. Sieć nie rozumie

pure_function

02.03.2024, 23:26:44 via Wykop

@JamesJoyce: ty chyba nie rozumiesz, co to znaczy "rozumiec".

JamesJoyce

03.03.2024, 10:20:26 via iOS

@pure_function co to znaczy „rozumieć”?

JamesJoyce

03.03.2024, 10:24:46 via iOS

@zibizz1 najpierw napisałeś:

„Odpowiednio duża sieć neuronowa rozumie”

Po prośbie o podanie publikacji, które tego dowodzą, zmieniasz zdanie i jednak sieć nie rozumie, a jak rozumie to „w sposób inny niż ludzki”.

pure_function

03.03.2024, 11:46:44 via Wykop

@JamesJoyce: nie da sie zdefiniowac "rozumienia" inaczej niz operacyjnie/behawioralnie (ale wtedy LLMs tez pod to podpadaja) lub fenomenologicznie (ludzie maja "doswiadczenie rozumienia", ale cala fenomenologia sprowadza sie do bitow informacji). w drugim przypadku LLMs moga emulowac rozumienie (bo to tylko bity informacji), co z praktycznego punktu widzenia nie rozni sie od ludzkiego rozumienia, jesli chodzi o mozliwosc rozwiazywania problemow, uczenia sie itp.

zibizz1

03.03.2024, 13:16:50 via Android

@JamesJoyce Ja cały czas uważam że rozumie. Tylko pokazuje że dyskusyjne jest znaczenie słowa rozumienie. Uważam że jest to bezmyślne nieświadome rozumienie, taki LLM zamienia słowa i zdania na abstrakcyjne twory i potrafi na nich poprawnie operować. Jak bardzo dobrze wykuty głąb. Tak, uważam że chat GPT 4 potrafi zagrać w grę jeśli wytłumaczysz mu zasady używając pojęć które rozumie, bazując na mechanikach z innych gier. Problem jest z tym żeby

JamesJoyce

03.03.2024, 13:51:18 via Wykop

@pure_function: Da się. Tylko Ty za bardzo redukujesz. Jest jeszcze podejście hermeneutyczne, konstruktywistyczne czy pragmatyczne.

Poza tym, istnieją jeszcze głębsze problemy z prostą redukcją rozumienia ludzkiego i maszynowego, np. tzw. problem ugruntowania symbolicznego https://en.wikipedia.org/wiki/Symbol_grounding_problem czy problem stochastycznych papug https://en.wikipedia.org/wiki/Stochastic_parrot

JamesJoyce

03.03.2024, 15:04:03 via Wykop

@zibizz1: Ok, ale uważasz tak na podstawie jakichś badań? Bo takich nie ma.

Pasterz30

03.03.2024, 17:22:46 via Wykop

@ZdeformowanyKreciRyj: @ElMatadore zeby to dzialalo to musialaby byc realna kopia lidzkiego mozgu. I nie, nie przyjmowalby tekstu, video itd, musialby byc uczony dokladnie tak jak ludzki mozg, od etapu dziecka, budowac polaczenia neuronowe bazujac na prostych bodzcach, wzrokowych, sluchowych itd. W innym wypadku nie mozemy mowic o swiadomosci i prawdziwego AGI a jedynie kolejnym, troche wiekszym chatem gpt. Nie jestesmy nawet blisko takiego rozwiazania

zibizz1

03.03.2024, 17:46:35 via Android

@JamesJoyce Uważam tak na podstawie używania od roku chat GPT 4, Analizując jak to działa nikt nie stwierdzi że on coś rozumie, przecież to zwykła funkcja matematyczna.
Ale ta funkcje matematyczna potrafi logiczne wnioskować, może na dość niskim poziomie i nie jakieś skomplikowane rzeczy ale potrafi

Aktywne Wpisy

duszan_z_kapitana_dupy

duszan_z_kapitana_dupy +32

5 godz. i 47 min temu

26 dni urlopu w Polsce to żart xD Przychodzi sezon letni i nagle tutaj Zdzisia nie ma 2 tygodnie, Ani 3 tygodnie, Basi nawet cały miesiąc (bo jeszcze przechodzi niewykorzystany xDD). Następnie ci sami ludzi biorą sobie jakieś dni wolne w majówki, na żądanie bo ktoś pochlał czy chce sobie jechać do energylandi w środku tygodnia. Jak w tym kraju ma być dobrze skoro ludzi nie ma w pracy praktycznie? Co chwila