Wpis z mikrobloga

@szmichal Dobry paradoks. Dane wsadowe zawierają szajs wygenerowany już przez AI. Biorąc pod uwagę fakt jak ludzie z tego korzystają, to AI zaraz na każdym kroku będzie nas chciało zrobić w #!$%@? albo przynajmniej mocno trolować xD

Czyli - AI dobre, tylko ludzie...
@szmichal stworzenie dobrych danych syntetycznych z reguły nie jest trudne, ale nie da się ich stworzyć tyle, ile zostało użyte do trenowania gpt3-4. Dlatego dane przed udostępnieniem chatuGPT i późniejszych modeli są na wagę złota bo nie są skażone.

Istnieje kilka sposobów rozwiązania tego problemu. Jednym z nich (i stosowanym obecnie) jest używanie do treningu danych z innych modalności, takich jak video czy audio.