Wpis z mikrobloga

[1] Cambridge: Innowacyjny system komunikacji dla osób z zaburzeniami mowy nazwany "inteligentnym gardłem" (IT), który wykorzystuje zaawansowane czujniki tekstylne do pomiaru wibracji mięśni szyi i sygnałów tętna oraz duży model językowy (LLM) do dekodowania mowy w czasie rzeczywistym. W testach z pacjentami po udarze system skutecznie korygował błędy i poprawiał komunikację, zwiększając satysfakcję użytkowników o 55%.

https://arxiv.org/abs/2411.18266

[2] Cambridge, AI Sweden i ESA: Autorzy tej pracy zbadali możliwość wykorzystania małego modelu segmentacji (MobileSAM) bezpośrednio na satelitach, aby przyspieszyć analizę zdjęć satelitarnych podczas klęsk żywiołowych. Wykazali, że model można szybko dostosowywać osiągając dobre wyniki przy minimalnej ilości danych treningowych. Badanie podkreśla potencjał SI w poprawie reagowania na ekstremalne zdarzenia pogodowe poprzez natychmiastową analizę danych bezpośrednio na orbicie.

https://arxiv.org/abs/2411.17831

[3] KAST i Microsoft: V2SFlow to nowy system Video-to-Speech generujący mowę z nagrań bez fonii. Rozkłada on sygnał mowy na podstawowe składniki i wykorzystuje architekturę Transformer do generowania realistycznej mowy z filmów wideo. Framework ten znacznie przewyższa dotychczasowe metody i nawet dorównuje naturalności oryginalnych wypowiedzi.

https://arxiv.org/abs/2411.19486

[4]Beihang, College London, Cambridge: Niniejsze badania przedstawiają ujednoliconą platformę integrującą czujniki do noszenia, monitoring otoczenia i duży model językowy (dla spersonalizowanych porad) do domowej rehabilitacji po udarze.

https://arxiv.org/abs/2411.19000


#codzienneainews #cainarxiv #sztucznainteligencja #gruparatowaniapoziomu
======================
Zawołać cię do kolejnego wpisu? Zaplusuj CENTRALNĄ LISTĘ DO WOŁANIA dostępną pod tym linkiem:

https://wykop.pl/wpis/78971397/centralna-lista-do-wolania-zaplusuj-ten-wpis-aby-b

Aby nie być dalej wołanym - odplusuj wspomniany wpis.
@PeterWeiss +506
CENTRALNA LISTA DO WOŁANIA

Zaplusuj ten wpis, aby być wołanym do wpisów spod tagu #codzienneainews

Aby nie być dalej wołanym - odplusuj ten wpis. Aby ponownie dopisać się do listy - zaplusuj ten wpis. Przy każdym wołaniu będę na bieżąco pobierał aktualną listę plusujących.
PeterWeiss - • [1] Cambridge: Innowacyjny system komunikacji dla osób z zaburzeniami ...

źródło: @AIFischerman 05

Pobierz
  • 12
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 125
Z kalendarza adwentowego OpenAI: OpenAI zaprezentowało pełną wersję O1, która:
→ charakteryzuje się "znaczącą poprawą wydajności w stosunku do GPT-4 w testach matematycznych, kodowania i ogólnej inteligencji."
→ "popełnia poważne błędy o 34% rzadziej niż O1 preview, jednocześnie myśląc o 50% szybciej".
→ zapewnia pełne możliwości multimodalne, umożliwiając połączone "rozumowanie" tekstu i obrazów z najlepszymi dotąd wynikami w benchmarkach MMMU i MathVista.

I potwierdzają się wcześniejsze plotki na temat nowych tierów: ChatGPT
PeterWeiss - Z kalendarza adwentowego OpenAI: OpenAI zaprezentowało pełną wersję O1, ...

źródło: GeDlEqrawAAb51w

Pobierz
  • Odpowiedz
@PeterWeiss: Ten post z Twittera ma jedną głupotę - gdyby traktować oba zadania w ten sam sposób - i.e. rozpoznawanie parku/rozpoznawanie ptaka - oba byłyby tak samo trudne. Ktoś założył, że wyciągnie GPS koordynaty z exif’u zdjecia, co nie zadziała w przypadku 99.9999% zdjęć w internecie.
  • Odpowiedz
@Hatespinner: bo może chodzi o apkę gdzie robisz live zdjęcia gdzieś będąc a nie o sprawdzanie zdjęć pobranych z neta. Zresztą telefon ma lokalizację a google lens a chat gpt, google lens i mnóstwo innych apek dziś rozpoznaje zdjęcia więc taka apka jest generalnie całkowicie bezużyteczna i pozbawiona jakiejkolwiek innowacji.
  • Odpowiedz