Wpis z mikrobloga

  • 0
@ruchliwy

apokaliptyczny scenariusz


To nie jest apokaliptyczny scenariusz, tylko bardzo pozytywny:
- Każda średniej wielkości firma będzie mogła zrobić to
  • Odpowiedz
  • 0
nawet zakładając że to co teraz mówisz, że sprawdzi się apokaliptyczny scenariusz bazujący na deklaracjach Chińczyków jest prawda to nie zobaczysz tego w wynikach finansowych przez najbliższe x kwartałów


@ruchliwy: nawet zakładając, że ten nastąpi jakiś przełom to każdy chyba zapomina, że wzrost wydajności danej technologii tylko napędzi na nie popyt - po prostu będzie więcej firm zajmujących się AI które będą potrzebowały kart od Nvidii. Mniejsi gracze ale o
  • Odpowiedz
  • 0
@golomb13

Teraz podwazyles sam siebie, jak ja mam wierzyc w badania po 3 dniach od wypuszczenia modelu, człowieku, w dodatku przeprowadzone przez samych chinczykow.


No a kiedy miało wyjść badanie jeśli dopiero to zrobili? xD
  • Odpowiedz
  • 0
@rimyi

niech najpierw pokażą metodykę trenowania modelu to pogadamy bo są poważne wątpliwości co do tego na czym faktycznie trenowali ten model xD


Pokazali badanie z metodą:
  • Odpowiedz
  • 0
@rimyi

@ruchliwy: nawet zakładając, że ten nastąpi jakiś przełom to każdy chyba zapomina, że wzrost wydajności danej technologii tylko napędzi na nie popyt - po prostu będzie więcej firm zajmujących się AI które będą potrzebowały kart od Nvidii. Mniejsi gracze ale o wiele więcej


Tak
  • Odpowiedz
  • 0
Co za różnica na czym trenowali, jeśli wyniki są takie same lub lepsze?


@mk321: przecież cała panika wzięła się stąd, że do wytrenowania modelu potrzebowali tylko 6 mln dolarów a nie gigantycznej farmy H100. To jest dosłownie cała różnica, o którą chodzi i o którą jest całe zamieszanie. Co ciekawe, sami w którymś wywiadzie przyznali, że używają tych czipów a nie powinni ich mieć więc poraz kolejny - niech pokażą
  • Odpowiedz
@rimyi wyniki działania modelu są takie same (zakładając, że benchmarki nie są całkowicie bezużyteczne), więc jest tak samo skuteczny. Panika bierze się stąd, że zrobili coś dużo taniej i jest taki sam efekt. Nie ma tylko szczegółów co dokładnie zrobili. Ale czy to aż tak ważne jeśli efekt jest ten sam?

Oczywiście jest kilka możliwości:

1. Zrobili to na starych kartach (tak można się domyślać wersji oficjalnej).
  • Odpowiedz
Panika bierze się stąd, że zrobili coś dużo taniej i jest taki sam efekt. Nie ma tylko szczegółów co dokładnie zrobili. Ale czy to aż tak ważne jeśli efekt jest ten sam?


@mk321: Nie no nie wytrzymię zaraz XD To jest najważniejsze w tej dyskusji bo o tym jest ten temat. Nie o tym, że parametry modelu zostały wrzucone do open source a to, ile kasy potrzeba, żeby wytrenować model do
  • Odpowiedz
@rimyi

Nie no nie wytrzymię zaraz XD To jest najważniejsze w tej dyskusji bo o tym jest ten temat.


Przypominam, że mówimy o giełdzie, a nie rozwoju AI. Tutaj istotne jest ile mniej sprzeda Nvidia. O ile Chińczycy nie kłamią (a żeby uwiarygodnić to udostępnili badania na temat optymalizacji treningu), to jest to rząd wielkości mniej. Jak to zrobili, to istotne w kontekście rozwoju AI, ale nie sprzedaży kart.
  • Odpowiedz
Mają dostęp do 10 000 H800, po $18k każda w optymistycznych szacunkach. To już $180mln

> Czemu akurat H800 i czemu aż tyle? Za $6 mln to raczej sporo mniej / sporo tańsze.

do wytrenowania modelu potrzebowali tylko 6 mln dolarów a nie gigantycznej farmy H100


@rimyi: mam
  • Odpowiedz