Wpis z mikrobloga

Skopiuj link

18.12.2024, 05:24:59

Naukowcy z Uniwersytetu Floryda Atlantic przeprowadzili pionierskie badanie mające na celu stworzenie systemu, który może w czasie rzeczywistym rozpoznawać gesty języka migowego (amerykańskiego ASL, bo język migowy nie jest uniwersalny).
Użyli oni MediaPipe do śledzenia ruchu dłoni oraz modelu YOLOv8 do stworzenia systemu rozpoznawania gestów. Jest to podejście, które nie było wcześniej stosowane w badaniach. Ich metoda osiągnęła imponującą dokładność na poziomie 98%(!)
Badanie ma ogromny potencjał praktyczny. Może pomóc:
→ Poprawić komunikację dla osób głuchych i słabosłyszących.
→ Ułatwiać interakcje w różnych dziedzinach życia takich jak edukacja, opieka zdrowotna czy kontakty społeczne.
Dalsze prace będą obejmować m.in. optymalizację modelu pod kątem działania na urządzeniach o ograniczonych zasobach (np .smartfonach, tabletach, okularach typu Meta Ray-Ban)
sciencedaily.com

NVIDIA wprowadza na rynek zestaw Jetson Orin Nano Super Developer Kit w cenie 249 USD. W skrócie: to SBC o wydajności ~67 TOPS, GPU Ampere z 1024 rdzeniami CUDA, 32 rdzeniami tensorowymi i 6-rdzeniowym procesorem ARM. Pamięć operacyjna jest zunifikowana, a jej przepustowość to niezłe (w porównaniu do innych SBC) 102 GB/s.
To by była fajna maszynka do lokalnych LLM-ów, gdyby nie jeden drobiazg: 8 GB pamięci... Ale rozczarowanie.
youtube.com
nvidia.com

Instytut Innowacji Technologicznych (TII) z Abu Zabi zaprezentował rodzinę modeli językowych Falcon3. Nowe modele o 1, 3, 7 i 10B parametrów zostały skrojone pod kątem nauk ścisłych, matematyki i programowania. W benchmarkach model 7B wypada porównywalnie do świetnego Qwen2.5-7B
huggingface.co/blog/falcon3

Ciekawy techniczny wpis na blogu HF o tym jak malutka Llama 3B pokonała ogromną Llamę 70B w testach matematycznych.
huggingface.co

Plotki: GPU Intel Battlemage B580 z 24 GB VRAM? W połączeniu z odpowiednią ceną byłaby to kuszące. Lokalne LLM lubią to!
Tę ciekawostkę zauważył użytkownik X, Tomasz Gawroński, który podczas weryfikacji dokumentu wysyłkowego zauważył dwa wpisy kart Battlemage G21 (znanych również jako Arc B580) z kluczowym określeniem: "clamshell". W kontekście kart graficznych termin ten oznacza sposób podłączenia modułów pamięci GDDR6, pozwalający na podwojenie standardowej pojemności VRAM.
x.com/GawroskiT

======================
Ujdzie? Daj plusa, zostaw komentarz, zasubskrybuj i kliknij w dzwonec... A, nie, to nie tutaj.
Tag do obserwowania lub czarnolistowania: >> #codzienneainews <<

======================
Zawołać cię do następnego wpisu? Zaplusuj CENTRALNĄ LISTĘ DO WOŁANIA dostępną pod tym linkiem:

https://wykop.pl/wpis/78971397/centralna-lista-do-wolania-zaplusuj-ten-wpis-aby-b

======================
Obraz: Kazi / wygenerowany w midjourney

@PeterWeiss +506

CENTRALNA LISTA DO WOŁANIA

Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews

Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.

PeterWeiss

18.12.2024, 05:25:03 via Wykop

Treść została ukryta...

@PeterWeiss +506

PeterWeiss

18.12.2024, 05:25:10 via Wykop

Treść została ukryta...

@PeterWeiss +506

PeterWeiss

18.12.2024, 05:25:17 via Wykop

Treść została ukryta...

@PeterWeiss +506

PeterWeiss

18.12.2024, 05:25:24 via Wykop

Wołam plusujących CENTRALNĄ LISTĘ DO WOŁANIA dostępną pod tym linkiem:

https://wykop.pl/wpis/78971397/centralna-lista-do-wolania-zaplusuj-ten-wpis-aby-b

Aby nie być dalej wołanym/wołaną - odplusuj zalinkowany wpis.

@PeterWeiss +506

PeterWeiss

18.12.2024, 05:25:48 via Wykop

Kalendarz adwentowy OpenAI: dzień 9.
→ O1 jest teraz dostępne przez API wraz z poniższymi feature'ami:
- Function calling (połączenie z zewnętrznymi danymi).
- Developer messages (instrukcje dotyczące stylu/tonu).
- Analiza obrazów i parametr reasoning_effort (kontrola nad czasem odpowiedzi).

→

PeterWeiss

18.12.2024, 05:26:11 via Wykop

Bonus: Udostępnione zostały checkpointy modelu BiMediX2. Jest to multimodalny model medyczny stworzony przez badaczy z Uniwersytetu im. Mohammeda bin Zayeda. Zbudowano go na bazie Llama 3.1 i potrafi on interpretować obrazy medyczne (RTG, CT, MRI). W celu rozszerzenia dostępu do opieki zdrowotnej dla ponad 400 milionów arabskojęzycznych użytkowników został on zintegrowany jako chatbot na platformie Telegram.

BiMediX2 zdobył nagrodę na Llama Impact Innovation Awards i był prezentowany na 79. Zgromadzeniu

PeterWeiss - Bonus: Udostępnione zostały checkpointy modelu BiMediX2. Jest to multimo... — **źródło:** BiMediX2
Pobierz

PanieAreczku

18.12.2024, 05:57:02 via Wykop

@PeterWeiss: to niesamowite !

seniorwykopek

18.12.2024, 07:02:36 via Android

@PeterWeiss można testować tego chatbota na telegramie?

Przegrywek123

18.12.2024, 08:02:23 via Wykop

Treść przeznaczona dla osób powyżej 18 roku życia...

Abadulahoson

18.12.2024, 08:27:00 via Android

@PeterWeiss Nawiązując do ostatniego bonusowego zdjęcia to nawet laik jest w stanie ocenić tak patologiczne pęknięcie/zmiażdżenie kręgu L4. Chciałbym zobaczyć jak LIam poradzi sobie ze zmianami zwyrodnieniowymi, które są mniej dostrzegalne dla oka w obrazie MRI.

Virsky

18.12.2024, 08:53:29 via Wykop

@PeterWeiss: tak właściwie to po co rozwijać język migowy w czasach gdy praktycznie wszystko może pisać i czytać?

realizta

18.12.2024, 09:20:37 via Wykop

@Virsky: nie rozwijać ale udostępnić oprogramowanie które płynnie przetłumaczy to głuchy do ciebie miga, np w przychodni, recepcji hotelu itp. Osoby głuche nawet jak mają implant mają spory problem nauczyć się wyraźnie mówić i takie rozwiązanie będzie na pewno dla nich bardziej komfortowe.