Wpis z mikrobloga

[0] Grok od xAI ma być dostępny za darmo dla każdego na platformie X. Limity: 10 promptów odnawiających się co 2 godziny; 10 obrazków co 2 godziny; 3 analizy obrazków dziennie. Dodatkowo z puli wypadł Grok-2-mini i wszystkie zapytania lecą do pełnego Grok-2. Jest też nowy model do generowania obrazów - Aurora. SOA/#2: u mnie nie działa ;-)

https://techcrunch.com/2024/12/06/2927301/


[1] Meta opublikowała nowy otwarty LLM Llama 3.3 70B. Model ten wypada w benchmarkach podobnie do Llama 3.1 405B, a w dodatku da się go uruchomić na normalnych komputerach. Kontekst jak w poprzednikach: 128k tokenów. Dane wykorzystane do szkolenia pochodzą max. z grudnia 2023.

https://huggingface.co/meta-llama/Llama-3.3-70B-Instruct


[2] A Alibaba wrzuciła multimodalny Qwen2-VL-72B, który "rozumie" już filmy trwające powyżej 20 minut. I jak zwykle jest w topce jeśli chodzi o benchmarki (i cenzurę ChRL :-P).

https://huggingface.co/Qwen/Qwen2-VL-7B-Instruct


[3] AWS ulepsza swoją platformę Bedrock dla LLM, wprowadzając buforowanie zapytań, automatyczne kierowanie zapytań do odpowiednich modeli i dostęp do modeli specjalistycznych. Ma to na celu obniżyć koszty i poprawić wydajność dużych modeli językowych.

https://techcrunch.com/2024/12/04/aws-brings-prompt-routing-and-caching-to-its-bedrock-llm-service/


[4] Google wprowadza PaliGemma 2, nową generację modelu językowego zorientowanego na wizję. W skład PG2 wchodzą trzy warianty modelu o różnej skali obsługujące różne rozdzielczości. Są one przystosowane do łatwego fine-tuningu dla różnych zastosowań.

https://huggingface.co/blog/paligemma2


[5] Firma Ruliad AI opublikowała Deepthought-8B, model LLM o 8 miliardach parametrów, zbudowany w oparciu o LLaMA-3.1, oferujący transparentne łańcuchy wnioskowania i skalowanie obliczeń w czasie testów. Model ten dorównuje wydajnością modelom w skali 70B, wymagając przy tym karty graficznej z jedynie 16 GB VRAMu. W języku angielskim rezultaty są zdumiewające jak na tak mały model. A po polsku... Szkoda szczempić ryja.

live demo: https://chat.ruliad.co/

https://huggingface.co/ruliad/deepthought-8b-llama-v0.01-alpha


[6] W nowej rundzie finansowania xAI zebrało 6 mld USD na rozbudowę swojego centrum obliczeniowego. Docelowo Colossus ma być wyposażony w 1 milion GPU.
Meta nie chcąc zostać w tyle wyłożyła 10 miliardów dolarów na nowe centrum obliczeniowe w Louisianie. Budowa zacznie się jeszcze w tym miesiącu i będą trwać do 2030.

https://techcrunch.com/2024/12/05/elon-musks-xai-lands-billions-in-new-cash-to-fuel-ai-ambitions/

https://gov.louisiana.gov/news/4697


Tag do obserwowania lub czarnolistowania #codzienneainews


======================
Zawołać cię do kolejnego wpisu? Zaplusuj CENTRALNĄ LISTĘ DO WOŁANIA dostępną pod tym linkiem:

https://wykop.pl/wpis/78971397/centralna-lista-do-wolania-zaplusuj-ten-wpis-aby-b

Aby nie być dalej wołanym - odplusuj wspomniany wpis.
@PeterWeiss +506
CENTRALNA LISTA DO WOŁANIA

Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews

Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
PeterWeiss - [0] Grok od xAI ma być dostępny za darmo dla każdego na platformie X. Li...

źródło: @BreezeChai 02

Pobierz
  • 12
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 0

Treść została ukryta...

@PeterWeiss +506
CENTRALNA LISTA DO WOŁANIA

Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews

Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
  • Odpowiedz
  • 15
Bonus: Tencent opublikował generator wideo o jakże wdzięcznej nazwie HunyuanVideo. Jak na model teoretycznie możliwy do odpalenia lokalnie wygląda on bardzo dobrze (a przynajmniej na promocyjnych nagraniach wideo). Potrafi generować do 129 klatek animacji (5 sekund) w rozdzielczości do 1280x720. Kłopot w tym, że wymaga karty obsługującej CUDA i mającej 60 GB VRAM na pokładzie (stąd "teoretycznie").

https://aivideo.hunyuan.tencent.com/
https://github.com/Tencent/HunyuanVideo
https://streamable.com/3au2pu
PeterWeiss - Bonus: Tencent opublikował generator wideo o jakże wdzięcznej nazwie Hun...
  • Odpowiedz
Będę wdzięczny za podpowiedź
Potrzebuję coś do uruchomienia lokalnie na ~4GB vRAM, wrzucić mu plik Excel/csv i zadać mu, że mam parametry produktu takie i takie, i by na podstawie danych znalazł podobne. Żadnych filozoficznych pytań, może być nawet po angielsku
  • Odpowiedz