18 marca 2024 roku w San Jose, NVIDIA zorganizowała konferencję GTC (GPU Technology Conference), jedno z najważniejszych wydarzeń w branży technologicznej. Wydarzenie przyciągnęło około 25 tysięcy uczestników na miejscu oraz 300 tysięcy widzów śledzących transmisję online. CEO firmy, Jensen Huang, podczas swojego wystąpienia podkreślił dynamiczny wzrost skali GTC, porównując je do "Super Bowl" świata AI. Jednak największe emocje wzbudziło ogłoszenie nowych układów GPU Blackwell oraz zmiana strategii na AI inference.
Blackwell Ultra GPU: Nowa era dla AI inference
Jednym z kluczowych ogłoszeń była premiera nowego układu GPU - NVIDIA Blackwell Ultra. Z początkowych spekulacji wynikało, że Blackwell Ultra zostanie oznaczony jako B300, ale ostatecznie NVIDIA pozostała przy oryginalnej nazwie. Nowy układ oferuje 50% wyższą wydajność niż poprzednia generacja B200, osiągając 15P FLOPS w formacie FP4 oraz wyposażony jest w 288GB pamięci HBM3E.
Blackwell Ultra został zaprojektowany z myślą o zadaniach inference (wnioskowania AI), w przeciwieństwie do układów H100 czy A100, które dominowały w treningu modeli AI. NVIDIA zaprezentowała dwa nowe systemy: GB300 NVL72 oraz HGX B300 NV16, oba zoptymalizowane do obsługi masowych operacji inference. Nowe produkty są reakcją na rosnące znaczenie efektywności AI, w kontekście kosztów utrzymania infrastruktury obliczeniowej.
Czy NVIDIA dostrzega koniec dominacji modelu Scaling Law?
Jednym z najciekawszych punktów konferencji była zmiana narracji w kontekście rozwoju AI. Przez lata zasada Scaling Law (im większy model, tym inteligentniejszy) napędzała rozwój AI. Teraz NVIDIA wskazuje na przejście od generatywnej AI do tzw. Agentic AI, gdzie kluczową rolę odgrywa inference. Czy oznacza to, że epoka masowego trenowania ogromnych modeli dobiega końca? Czy nowa generacja AI bardziej skoncentrowana na autonomii będzie wymagać innych zasobów obliczeniowych?
Rubin i Feynman: Przyszłość AI w 2026 i 2028 roku
Podczas GTC Jensen Huang zapowiedział również przyszłe architektury GPU - Rubin (2026) oraz Feynman (2028). Rubin Ultra GPU ma osiągnąć 100P FLOPS w FP4 i wykorzysta pamięć HBM4E. NVIDIA planuje wprowadzenie Rubin NVL144 w 2026 roku oraz Rubin Ultra NVL576 w 2027 roku, zwiększając skalę obliczeniową do niewyobrażalnych dotąd poziomów.
Nowe technologie: sieci optyczne, robotyka i komputery kwantowe
Oprócz GPU, NVIDIA zaprezentowała również nowe przełomowe technologie. W dziedzinie sieci optycznych firma ogłosiła dwa nowe przełomowe przełączniki - Spectrum-X oraz Quantum-X, wykorzystujące technologię Co-Packaged Optics (CPO). NVIDIA mocno inwestuje także w robotykę, udostępniając model GROOT N1 jako otwarte oprogramowanie. Na froncie badań nad komputerami kwantowymi firma zapowiedziała otwarcie NVIDIA Accelerated Quantum Research Center (NVAQC) w Bostonie.
Co to wszystko oznacza dla rynku AI i sprzętu?
Czy przejście z AI training do AI inference zwiastuje koniec ery masowego skalowania modeli? Czy inwestycje w robotykę i optyczne sieci zmienią podejście do budowy centrów danych? Jak wpłynie to na rynek wtórny GPU, gdzie firmy chcące sell GPU mogą mieć szansę na odsprzedaż starszych modeli?
To, co stało się na GTC 2024, może oznaczać nowy rozdział dla całej branży AI. Jakie są Wasze przemyślenia? Czy zmiany zaproponowane przez NVIDIA rzeczywiście zmienią krajobraz AI, czy to tylko kolejny krok w ewolucji technologii? Podzielcie się swoimi opiniami!
#GTC2015 #Nvidia #GPU #GraphicsCard #AI







Komentarze (3)
najlepsze