Przeczytałem cały raport techniczny nt. Gemini. Sporo niewiadomych. Jedno jest pewne. Oszukiwanie w benchmarkach. Moja opinia jest taka, że GPT4>Gemini>GPT 3.5 w darmowej wersji ChatuGPT. Z darmowych modeli chyba staje na podium. Z modeli ogólnie nie.
Co ciekawe, wygląda na to że nie tylko nie ma żadnego przełomu jeśli chodzi o architekturę, ale wręcz podejście im więcej danych, tym lepszy model wciąż jest kultywowowane i rozwijane. Zobaczymy co przyniesie przyszłość. Przyjmowanie video i audio, jako dane treningowe to pewna nadzieja na kończące się zasoby dobrych danych.
@kutafonixor bruteforce. Aktualnie niemożliwe do użycia na masową skalę, nie ma tylu gpu, a jak są to kosztowałoby to fortunę. Poza tym to są problemy typowo codexowe, nie normalne, komercyjne programowanie. Ale raport też ciekawy.
Poza tym to są problemy typowo codexowe, nie normalne, komercyjne programowanie.
@JamesJoyce: to prawda ale pokazuje w którym kierunku to wszystko idzie. Kilka lat temu nie było żadnego Ai które umiało kodować czy rozmawiać jak człowiek a teraz większość programistów korzysta z copilotów w ide i ułatwia im to pracę. Zresztą te zadania są dużo trudniejsze od codziennej roboty programisty.
Co do Gemini to tak na prawdę gonią gpt4 które zostało
@JamesJoyce: nie był wyuczony na dokładnie takich zadaniach, w tym szkopuł. Jak jest napisane zero shot to znaczy że model sam to rozkminił i nigdy podobnego na oczy nie widział
Przyjmowanie video i audio, jako dane treningowe to pewna nadzieja na kończące się zasoby dobrych danych.
@JamesJoyce: no nie do konca: 1) tych danych nie jest za duzo w porownaniu do tekstu (yt to z tego co widze "tylko" 1B filmow, czyli powiedzmy kilkaset milionow godzin, z audio jest jeszcze gorzej) 2) gorsze legal issues niz tekst (wizerunek, dane biometryczne etc)
Przeczytałem cały raport techniczny nt. Gemini. Sporo niewiadomych. Jedno jest pewne. Oszukiwanie w benchmarkach. Moja opinia jest taka, że GPT4>Gemini>GPT 3.5 w darmowej wersji ChatuGPT. Z darmowych modeli chyba staje na podium. Z modeli ogólnie nie.
Co ciekawe, wygląda na to że nie tylko nie ma żadnego przełomu jeśli chodzi o architekturę, ale wręcz podejście im więcej danych, tym lepszy model wciąż jest kultywowowane i rozwijane. Zobaczymy co przyniesie przyszłość. Przyjmowanie video i audio, jako dane treningowe to pewna nadzieja na kończące się zasoby dobrych danych.
@JamesJoyce: to prawda ale pokazuje w którym kierunku to wszystko idzie. Kilka lat temu nie było żadnego Ai które umiało kodować czy rozmawiać jak człowiek a teraz większość programistów korzysta z copilotów w ide i ułatwia im to pracę. Zresztą te zadania są dużo trudniejsze od codziennej roboty programisty.
Co do Gemini to tak na prawdę gonią gpt4 które zostało
@JamesJoyce: no nie do konca:
1) tych danych nie jest za duzo w porownaniu do tekstu (yt to z tego co widze "tylko" 1B filmow, czyli powiedzmy kilkaset milionow godzin, z audio jest jeszcze gorzej)
2) gorsze legal issues niz tekst (wizerunek, dane biometryczne etc)