Wpis z mikrobloga

Skopiuj link

26.09.2024, 11:32:16

W jaki sposób robi się fine-tuning LLMa? Czytałem pobieżnie dokumentacje OpenAI i jest opisana metoda, że ładuje się "prompt" i "answer"

Co jeśli do LLMa chce załadować swoje dokumenty źródłowe - mam potencjalnie źródeł o długości kilku mln tokenów.

Są tam dokumenty źródłowe, dokumentacja, sposoby użycia - czy ja mam wszystko przerobić na JSONa "prompt":"answer"?

Polecicie ewentualnie jakieś materiały które mogłyby mnie zagłębić w temat?

#sztucznainteligencja

tylkosieturozgladam

26.09.2024, 12:02:01 via iOS

@hub_bub nie widzę sensu fine-tuningu pod dokumenty. Spotkałem się z paroma badaniami, które wprost wykazywały spadek efektywności LLM po małych FT.

Zamiast tego lepiej zembeddowac chunki dokumentu, skorzystać z bazy wektorowej i dorzucać do promptu jako knowledge base

JamesJoyce

26.09.2024, 12:45:03 via iOS

@hub_bub Ten drugi przypadek często jest robiony za pomocą RAG. Działa to znacznie szybciej.

Finetuning jest rzadszy, bo bez zaawansowanych technik jak Lora jest kosztowny i często brakuje danych do tego.

Poza tym są jeszcze inne rodzaje dostosowywania llmow pod swoje problemy. ALE jest sporo papierów pokazujących, że nie zawsze warto to robić.

hub_bub

26.09.2024, 13:09:37 via iOS

@JamesJoyce dzięki ten RAG to może być to o co mi chodzi. Dość skomplikowany temat ale wiem że w mojej dziedzinie systemy zatrzymały się na latach 90.
Obecnie dostępne płatne wyszukiwarki w zasadzie wykorzystują tylko dopasowanie dokładne

JamesJoyce

26.09.2024, 13:13:22 via Wykop

@hub_bub: A co chcesz osiągnąć?

hub_bub

26.09.2024, 13:43:26 via iOS

@JamesJoyce mam bazę wyroków sądowych z jednej dziedziny prawa. + ustawy,kodeksy,komentarze. Chce stworzyć takiego wirtualnego aplikanta który draftuje pisma

JamesJoyce

26.09.2024, 14:25:21 via Wykop

@hub_bub: https://www.youtube.com/watch?v=KfqJsqIFeRY&ab_channel=Cohere

hub_bub

26.09.2024, 16:00:38 via Wykop

@JamesJoyce: dzięki, posłucham sobie w wolnym czasie

Aktywne Wpisy

ZdzislawRotterdam

ZdzislawRotterdam +164

5 godz. i 36 min temu

Ale trzeba być niedorobionym żeby takie coś wstawiać ( ͡° ͜ʖ ͡°) #audi #kaldi #audiarze

ZdzislawRotterdam - Ale trzeba być niedorobionym żeby takie coś wstawiać ( ͡° ͜ʖ ͡°) ... — **źródło:** 1000021087
Pobierz

Zopyross

Zopyross +3

3 godz. i 12 min temu

Coraz częściej widzę oferty sprzedaży domów jednorodzinnych zakładających wymianę za mieszkanie i dopłatę albo dwa mieszkania. Za takimi wariantami kryją się dramaty rodzinne, pewnie chłop stawiał duży dom z myślą, że się tu jeszcze wnuki odchowają a tymczasem córka z synem trochę podrośli, dowody z urzędu odebrali i zakomunikowali, że się wyprowadzają a najlepiej to im mieszkanie w centrum gdzieś kup
Dzisiaj niemożliwością jest odtworzenie wielopokoleniowej rodziny żyjącej w modelu naszych dziadków,

Zopyross - Coraz częściej widzę oferty sprzedaży domów jednorodzinnych zakładających ... — **źródło:** dzci
Pobierz

Aktywne Wpisy

Aktywne Znaleziska

Gran Canaria - Imigrant z nożem zabity na lotnisku przez policje

2025 Wybory prezydenckie, prosta strona pokazująca proces liczenia głosów

WHO na Antarktydzie testuje reakcje na wypadek wubuchu pandemi Ospy Mamuciej TLD

Zakaz fotografowania głównej siedziby TVP.

DEWELOPERZY PODNIEŚLI CENY, BO... MUSIELI. TO WINA PAŃSTWA I NAS SAMYCH

Popularne tagi