Wpis z mikrobloga

Skopiuj link

28.09.2024, 04:28:49

#codzienneainews
• [1] Llama Stack upraszcza tworzenie aplikacji agentowych
Meta wydała Llama Stack, nowy interfejs API, upraszcza wdrażanie i dostosowywanie modeli Llama.

• [2] Emu3: Rewolucja w AI multimodalnym dzięki przewidywaniu kolejnego tokena
AAI wypuściło model Emu3, który wykorzystuje przewidywanie kolejnego tokena do generowania obrazów, tekstu i wideo. W przeciwieństwie do tradycyjnych modeli opartych na złożonych metodach, takich jak modele dyfuzyjne (np. Stable Diffusion) lub modele kompozytowe (np. CLIP z LLM), Emu3 używa pojedynczego transformera do obsługi sekwencji multimodalnych. Poprzez tokenizację obrazów, wideo i tekstu w przestrzeni dyskretnej, Emu3 osiąga najnowocześniejsze wyniki w zadaniach generowania (np. wysokiej jakości obrazy i wideo) oraz percepcji (np. zrozumienie wizji i języka).

Najważniejszą informacją jest to, że Emu3 przewyższa modele specjalistyczne takie jak SDXL w generowaniu obrazów oraz LLaVA w rozumieniu wizji i języka, nie polegając na metodach dyfuzyjnych ani innych. Uproszczona architektura skupia się wyłącznie na przewidywaniu kolejnego tokena, co ułatwia skalowanie podczas treningu i wnioskowania. Model wprowadza również przełomowe techniki w generowaniu wideo, przewidując kolejny token w sekwencji, co pozwala na rozszerzanie wideo na podstawie danych wejściowych.

• [3] API voice2voice dla agentów AI
Deepgram zaprezentował Deepgram Voice Agent API, ujednolicony interfejs API voice-to-voice dla agentów AI, który umożliwia naturalnie brzmiące rozmowy między ludźmi i maszynami

• [4] Inwestycje, inwestycje
Fundusz Blackstone zainwestuje 10 miliardów funtów (50 mld zł) w stworzenie "największego centrum obliczeniowego w Europie" w północno-wschodniej Anglii.
Google inwestuje 3,3 miliarda dolarów (13 mld zł) w Karolinie Południowej. Za te pieniądze postawione zostaną dwa nowe centra obliczeniowe i rozbudowana zostanie infrastruktura.
Microsoft ogłasza inwestycję o wartości 1,3 mld USD (5 mld zł) w infrastrukturę dla SI w Meksyku.

#ainews #sztucznainteligencja #gruparatowaniapoziomu

PeterWeiss

28.09.2024, 04:28:55 via Wykop

Odnośniki:
[1]
https://ai.meta.com/blog/llama-3-2-connect-2024-vision-edge-mobile-devices/

[2]
https://github.com/baaivision/Emu3

PeterWeiss

28.09.2024, 04:29:27 via Wykop

Bonus: Jak GTA: Vice City mogłoby wyglądać, gdyby zostało wydane w 2024 roku. Filmik powstał przy użyciu generatora Runway Gen 3 w trybie video-to-video.

https://streamable.com/yc5mn0

PeterWeiss - Bonus: Jak GTA: Vice City mogłoby wyglądać, gdyby zostało wydane w 2024 ...

kutokalipsa67

28.09.2024, 04:38:36 via Wykop

@PeterWeiss: mokry sen wydawców gier - automat robiący remake'i jednym kliknięciem.

Lardor

28.09.2024, 04:54:10 via Android

@PeterWeiss niby by mogło ale wzięło się za to lewackie studio i zrobili z dobrej gry gniota.

Lardor - @PeterWeiss niby by mogło ale wzięło się za to lewackie studio i zrobili z d... — **źródło:** temp_file6502696099970813707
Pobierz

Wejd1

28.09.2024, 06:09:09 via Wykop

@kutokalipsa67: Wydaje mi się, że jeszcze chwila i wydawcy nie będą do tego potrzebni - odpowiednia nakładka z ustawieniami i każdą grę przerobi.

Tak czy inaczej - pograłbym ( ͡° ͜ʖ ͡°)