Naukowcy z Uniwersytetu Floryda Atlantic przeprowadzili pionierskie badanie mające na celu stworzenie systemu, który może w czasie rzeczywistym rozpoznawać gesty języka migowego (amerykańskiego ASL, bo język migowy nie jest uniwersalny). Użyli oni MediaPipe do śledzenia ruchu dłoni oraz modelu YOLOv8 do stworzenia systemu rozpoznawania gestów. Jest to podejście, które nie było wcześniej stosowane w badaniach. Ich metoda osiągnęła imponującą dokładność na poziomie 98%(!) Badanie ma ogromny potencjał praktyczny. Może pomóc: → Poprawić komunikację dla osób głuchych i słabosłyszących. → Ułatwiać interakcje w różnych dziedzinach życia takich jak edukacja, opieka zdrowotna czy kontakty społeczne. Dalsze prace będą obejmować m.in. optymalizację modelu pod kątem działania na urządzeniach o ograniczonych zasobach (np .smartfonach, tabletach, okularach typu Meta Ray-Ban) sciencedaily.com
NVIDIA wprowadza na rynek zestaw Jetson Orin Nano Super Developer Kit w cenie 249 USD. W skrócie: to SBC o wydajności ~67 TOPS, GPU Ampere z 1024 rdzeniami CUDA, 32 rdzeniami tensorowymi i 6-rdzeniowym procesorem ARM. Pamięć operacyjna jest zunifikowana, a jej przepustowość to niezłe (w porównaniu do innych SBC) 102 GB/s. To by była fajna maszynka do lokalnych LLM-ów, gdyby nie jeden drobiazg: 8 GB pamięci... Ale rozczarowanie. youtube.com nvidia.com
Instytut Innowacji Technologicznych (TII) z Abu Zabi zaprezentował rodzinę modeli językowych Falcon3. Nowe modele o 1, 3, 7 i 10B parametrów zostały skrojone pod kątem nauk ścisłych, matematyki i programowania. W benchmarkach model 7B wypada porównywalnie do świetnego Qwen2.5-7B huggingface.co/blog/falcon3
Ciekawy techniczny wpis na blogu HF o tym jak malutka Llama 3B pokonała ogromną Llamę 70B w testach matematycznych. huggingface.co
Plotki: GPU Intel Battlemage B580 z 24 GB VRAM? W połączeniu z odpowiednią ceną byłaby to kuszące. Lokalne LLM lubią to! Tę ciekawostkę zauważył użytkownik X, Tomasz Gawroński, który podczas weryfikacji dokumentu wysyłkowego zauważył dwa wpisy kart Battlemage G21 (znanych również jako Arc B580) z kluczowym określeniem: "clamshell". W kontekście kart graficznych termin ten oznacza sposób podłączenia modułów pamięci GDDR6, pozwalający na podwojenie standardowej pojemności VRAM. x.com/GawroskiT
====================== Ujdzie? Daj plusa, zostaw komentarz, zasubskrybuj i kliknij w dzwonec... A, nie, to nie tutaj. Tag do obserwowania lub czarnolistowania: >> #codzienneainews <<
====================== Zawołać cię do następnego wpisu? Zaplusuj CENTRALNĄ LISTĘ DO WOŁANIA dostępną pod tym linkiem:
Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews
Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews
Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews
Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews
Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews
Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
Kalendarz adwentowy OpenAI: dzień 9. → O1 jest teraz dostępne przez API wraz z poniższymi feature'ami: - Function calling (połączenie z zewnętrznymi danymi). - Developer messages (instrukcje dotyczące stylu/tonu). - Analiza obrazów i parametr reasoning_effort (kontrola nad czasem odpowiedzi).
Bonus: Udostępnione zostały checkpointy modelu BiMediX2. Jest to multimodalny model medyczny stworzony przez badaczy z Uniwersytetu im. Mohammeda bin Zayeda. Zbudowano go na bazie Llama 3.1 i potrafi on interpretować obrazy medyczne (RTG, CT, MRI). W celu rozszerzenia dostępu do opieki zdrowotnej dla ponad 400 milionów arabskojęzycznych użytkowników został on zintegrowany jako chatbot na platformie Telegram.
BiMediX2 zdobył nagrodę na Llama Impact Innovation Awards i był prezentowany na 79. Zgromadzeniu
@PeterWeiss Nawiązując do ostatniego bonusowego zdjęcia to nawet laik jest w stanie ocenić tak patologiczne pęknięcie/zmiażdżenie kręgu L4. Chciałbym zobaczyć jak LIam poradzi sobie ze zmianami zwyrodnieniowymi, które są mniej dostrzegalne dla oka w obrazie MRI.
@Virsky: nie rozwijać ale udostępnić oprogramowanie które płynnie przetłumaczy to głuchy do ciebie miga, np w przychodni, recepcji hotelu itp. Osoby głuche nawet jak mają implant mają spory problem nauczyć się wyraźnie mówić i takie rozwiązanie będzie na pewno dla nich bardziej komfortowe.
#wykopaka Czy wypada parze która chce jeść zdrowo i zrzucić kilka kg zrobić trolllowo pieroga z filcu? ( ͡º͜ʖ͡º) Kuwa, obiecałam że będzie moje rękodzieło w paczce i będzie (╯°□°)╯︵┻━┻
Użyli oni MediaPipe do śledzenia ruchu dłoni oraz modelu YOLOv8 do stworzenia systemu rozpoznawania gestów. Jest to podejście, które nie było wcześniej stosowane w badaniach. Ich metoda osiągnęła imponującą dokładność na poziomie 98%(!)
Badanie ma ogromny potencjał praktyczny. Może pomóc:
→ Poprawić komunikację dla osób głuchych i słabosłyszących.
→ Ułatwiać interakcje w różnych dziedzinach życia takich jak edukacja, opieka zdrowotna czy kontakty społeczne.
Dalsze prace będą obejmować m.in. optymalizację modelu pod kątem działania na urządzeniach o ograniczonych zasobach (np .smartfonach, tabletach, okularach typu Meta Ray-Ban)
sciencedaily.com
NVIDIA wprowadza na rynek zestaw Jetson Orin Nano Super Developer Kit w cenie 249 USD. W skrócie: to SBC o wydajności ~67 TOPS, GPU Ampere z 1024 rdzeniami CUDA, 32 rdzeniami tensorowymi i 6-rdzeniowym procesorem ARM. Pamięć operacyjna jest zunifikowana, a jej przepustowość to niezłe (w porównaniu do innych SBC) 102 GB/s.
To by była fajna maszynka do lokalnych LLM-ów, gdyby nie jeden drobiazg: 8 GB pamięci... Ale rozczarowanie.
youtube.com
nvidia.com
Instytut Innowacji Technologicznych (TII) z Abu Zabi zaprezentował rodzinę modeli językowych Falcon3. Nowe modele o 1, 3, 7 i 10B parametrów zostały skrojone pod kątem nauk ścisłych, matematyki i programowania. W benchmarkach model 7B wypada porównywalnie do świetnego Qwen2.5-7B
huggingface.co/blog/falcon3
Ciekawy techniczny wpis na blogu HF o tym jak malutka Llama 3B pokonała ogromną Llamę 70B w testach matematycznych.
huggingface.co
Plotki: GPU Intel Battlemage B580 z 24 GB VRAM? W połączeniu z odpowiednią ceną byłaby to kuszące. Lokalne LLM lubią to!
Tę ciekawostkę zauważył użytkownik X, Tomasz Gawroński, który podczas weryfikacji dokumentu wysyłkowego zauważył dwa wpisy kart Battlemage G21 (znanych również jako Arc B580) z kluczowym określeniem: "clamshell". W kontekście kart graficznych termin ten oznacza sposób podłączenia modułów pamięci GDDR6, pozwalający na podwojenie standardowej pojemności VRAM.
x.com/GawroskiT
======================
Ujdzie? Daj plusa, zostaw komentarz, zasubskrybuj i kliknij w dzwonec... A, nie, to nie tutaj.
Tag do obserwowania lub czarnolistowania: >> #codzienneainews <<
======================
Zawołać cię do następnego wpisu? Zaplusuj CENTRALNĄ LISTĘ DO WOŁANIA dostępną pod tym linkiem:
======================
Obraz: Kazi / wygenerowany w midjourney
Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews
Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
źródło: @Kazi5isAlive 01
PobierzTreść została ukryta...
Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews
Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
Treść została ukryta...
Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews
Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
Treść została ukryta...
Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews
Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
Aby nie być dalej wołanym/wołaną - odplusuj zalinkowany wpis.
Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews
Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
→ O1 jest teraz dostępne przez API wraz z poniższymi feature'ami:
- Function calling (połączenie z zewnętrznymi danymi).
- Developer messages (instrukcje dotyczące stylu/tonu).
- Analiza obrazów i parametr
reasoning_effort(kontrola nad czasem odpowiedzi).→
źródło: 66981005b4742
PobierzBiMediX2 zdobył nagrodę na Llama Impact Innovation Awards i był prezentowany na 79. Zgromadzeniu
źródło: BiMediX2
Pobierz