Wpis z mikrobloga

Skopiuj link

08.12.2024, 05:25:05

[0] Grok od xAI ma być dostępny za darmo dla każdego na platformie X. Limity: 10 promptów odnawiających się co 2 godziny; 10 obrazków co 2 godziny; 3 analizy obrazków dziennie. Dodatkowo z puli wypadł Grok-2-mini i wszystkie zapytania lecą do pełnego Grok-2. Jest też nowy model do generowania obrazów - Aurora. SOA/#2: u mnie nie działa ;-)

https://techcrunch.com/2024/12/06/2927301/

[1] Meta opublikowała nowy otwarty LLM Llama 3.3 70B. Model ten wypada w benchmarkach podobnie do Llama 3.1 405B, a w dodatku da się go uruchomić na normalnych komputerach. Kontekst jak w poprzednikach: 128k tokenów. Dane wykorzystane do szkolenia pochodzą max. z grudnia 2023.

https://huggingface.co/meta-llama/Llama-3.3-70B-Instruct

[2] A Alibaba wrzuciła multimodalny Qwen2-VL-72B, który "rozumie" już filmy trwające powyżej 20 minut. I jak zwykle jest w topce jeśli chodzi o benchmarki (i cenzurę ChRL :-P).

https://huggingface.co/Qwen/Qwen2-VL-7B-Instruct

[3] AWS ulepsza swoją platformę Bedrock dla LLM, wprowadzając buforowanie zapytań, automatyczne kierowanie zapytań do odpowiednich modeli i dostęp do modeli specjalistycznych. Ma to na celu obniżyć koszty i poprawić wydajność dużych modeli językowych.

https://techcrunch.com/2024/12/04/aws-brings-prompt-routing-and-caching-to-its-bedrock-llm-service/

[4] Google wprowadza PaliGemma 2, nową generację modelu językowego zorientowanego na wizję. W skład PG2 wchodzą trzy warianty modelu o różnej skali obsługujące różne rozdzielczości. Są one przystosowane do łatwego fine-tuningu dla różnych zastosowań.

https://huggingface.co/blog/paligemma2

[5] Firma Ruliad AI opublikowała Deepthought-8B, model LLM o 8 miliardach parametrów, zbudowany w oparciu o LLaMA-3.1, oferujący transparentne łańcuchy wnioskowania i skalowanie obliczeń w czasie testów. Model ten dorównuje wydajnością modelom w skali 70B, wymagając przy tym karty graficznej z jedynie 16 GB VRAMu. W języku angielskim rezultaty są zdumiewające jak na tak mały model. A po polsku... Szkoda szczempić ryja.

live demo: https://chat.ruliad.co/

https://huggingface.co/ruliad/deepthought-8b-llama-v0.01-alpha

[6] W nowej rundzie finansowania xAI zebrało 6 mld USD na rozbudowę swojego centrum obliczeniowego. Docelowo Colossus ma być wyposażony w 1 milion GPU.
Meta nie chcąc zostać w tyle wyłożyła 10 miliardów dolarów na nowe centrum obliczeniowe w Louisianie. Budowa zacznie się jeszcze w tym miesiącu i będą trwać do 2030.

https://techcrunch.com/2024/12/05/elon-musks-xai-lands-billions-in-new-cash-to-fuel-ai-ambitions/

https://gov.louisiana.gov/news/4697

Tag do obserwowania lub czarnolistowania #codzienneainews

======================
Zawołać cię do kolejnego wpisu? Zaplusuj CENTRALNĄ LISTĘ DO WOŁANIA dostępną pod tym linkiem:

https://wykop.pl/wpis/78971397/centralna-lista-do-wolania-zaplusuj-ten-wpis-aby-b

Aby nie być dalej wołanym - odplusuj wspomniany wpis.

@PeterWeiss +506

CENTRALNA LISTA DO WOŁANIA

Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews

Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.

PeterWeiss

08.12.2024, 05:25:11 via Wykop

Treść została ukryta...

@PeterWeiss +506

PeterWeiss

08.12.2024, 05:25:21 via Wykop

PeterWeiss

08.12.2024, 05:25:38 via Wykop

Bonus: Tencent opublikował generator wideo o jakże wdzięcznej nazwie HunyuanVideo. Jak na model teoretycznie możliwy do odpalenia lokalnie wygląda on bardzo dobrze (a przynajmniej na promocyjnych nagraniach wideo). Potrafi generować do 129 klatek animacji (5 sekund) w rozdzielczości do 1280x720. Kłopot w tym, że wymaga karty obsługującej CUDA i mającej 60 GB VRAM na pokładzie (stąd "teoretycznie").

https://aivideo.hunyuan.tencent.com/
https://github.com/Tencent/HunyuanVideo
https://streamable.com/3au2pu

PeterWeiss - Bonus: Tencent opublikował generator wideo o jakże wdzięcznej nazwie Hun...

uefaman

08.12.2024, 05:37:11 via Wypiek

@PeterWeiss @PeterWeiss gdzie zalogować się do hunyuana? Widzę tylko logowanie (?) po chińsku

Szala

08.12.2024, 07:09:45 via Android

@PeterWeiss orientujesz się, który z lokalnych modeli najlepiej wspiera język polski?

foneswein

08.12.2024, 07:44:07 via Wykop

Będę wdzięczny za podpowiedź
Potrzebuję coś do uruchomienia lokalnie na ~4GB vRAM, wrzucić mu plik Excel/csv i zadać mu, że mam parametry produktu takie i takie, i by na podstawie danych znalazł podobne. Żadnych filozoficznych pytań, może być nawet po angielsku

szczepan-szczypawa

08.12.2024, 08:49:52 via Android

@foneswein do tego nie jest potrzebny llm tylko klasyczny machinę learning. Sprawdź hasła k nearest neighbors I k-means. Z chatem gpt zaimplementujesz to w mniej niż 10 minut.

MirkoLord

08.12.2024, 09:39:41 via Wykop

@PeterWeiss: u mnie już zaczął banglać flux beta na X, z tego co widzę, generuje dużo lepsze obrazki

ReksioZaglady

08.12.2024, 09:59:40 via Wykop

@PeterWeiss: na 24 VRAM również pójdzie - https://github.com/kijai/ComfyUI-HunyuanVideoWrapper

PeterWeiss

08.12.2024, 11:05:13 via Wykop

@uefaman: Musisz mieć chiński nr telefonu, żeby się zarejestrować.

@ReksioZaglady Owszem, ale w turbo niskich rozdzielczościach typu 512x320.

PeterWeiss

08.12.2024, 11:23:40 via Wykop

@Szala: Ponoć nowy Bielik-11B-v2 jest w miarę ok. Bazuje na mistralu 7B i ludzie go sobie chwalą. Sam nie testowałem. Odpuściłem sobie polskie llmy po kontakcie z pierwszym Bielikiem i Qrą (bazującą na zabytkowej Llamie 2).

Demo (wymaga zalogowania np przez spamkonto google) https://chat.bielik.ai
Chat Arena: https://arena.speakleash.org.pl/
https://huggingface.co/speakleash/Bielik-11B-v2.2-Instruct