#codzienneainews _newsy medyczne, o transformerach, zbiorach danych, l... (@PeterWeiss)

#codzienneainews newsy medyczne, o transformerach, zbiorach danych, lodówkach i innych generatorach

• [1] SI odkrywa warianty DNA powiązane z zaburzeniami psychicznymi
Naukowcy ze Stanford opracowali nowe narzędzie SI o nazwie ARC-SV, które jest w stanie wykrywać złożone warianty strukturalne w ludzkim genomie z dokładnością 95%. Analizując ponad 4000 genomów z całego świata, algorytm zidentyfikował ponad 8000 różnych złożonych wariantów DNA, o długości od 200 do 100 000 par zasad. Wiele z tych wariantów znajduje się w regionach genomu odpowiedzialnych za rozwój i funkcjonowanie mózgu.

Badacze wykorzystali to odkrycie do zbadania związków między tymi wariantami a chorobami psychicznymi, szczególnie schizofrenią i chorobą dwubiegunową. Analiza próbek tkanek mózgowych od ponad 100 osób (zarówno zdrowych, jak i chorych) wykazała, że zidentyfikowane warianty często pokrywają się z regionami genomu wcześniej powiązanymi z ryzykiem rozwoju tych chorób. Co więcej, warianty te wpływają na ekspresję pobliskich genów, co sugeruje ich bezpośredni udział w rozwoju chorób psychicznych i otwiera nowe możliwości w zakresie zrozumienia i leczenia tych schorzeń. Poprzednie metody te związki przeoczyły.

• [2] Narzędzie AI pomoże wykryć złamania i pęknięcia kości
Narodowy Instytut Zdrowia i Opieki (NICE) w Wielkiej Brytanii planuje rekomendować cztery narzędzia AI do użytku w pilnej opiece zdrowotnej, które mają wspierać pracowników medycznych, przyspieszać diagnozę i zmniejszać potrzebę powtórnych wizyt. Jedno z narzędzi ma pomóc lekarzom w wykrywaniu złamań na zdjęciach rentgenowskich. Wg aktualnych danych aż w 3-10% przypadków medycy nie zauważają złamanych lub pękniętych kości. "Asystent" nie będzie działać samodzielnie - obrazy zawsze będą przeglądane przez specjalistę.

• [3] Nowatorska architektura sieci neuronowych
Naukowcy z NVIDIA stworzyli nową architekturę LLM nazwaną nGPT, która działa znacznie wydajniej dzięki specjalnemu sposobowi normalizacji danych na hipersferze. W porównaniu do standardowego GPT, nowy model potrzebuje od 4 do 20 razy mniej czasu na trening i osiąga lepsze wyniki, szczególnie przy analizie dłuższych tekstów.

• [4] Meta udostępnia ogromny zbiór danych dla SI
Meta udostępniła za darmo ogromny zbiór danych i modele AI nazwane Open Materials 2024 (OMat24), które mają przyspieszyć odkrywanie nowych materiałów. Jest to znaczący krok naprzód, ponieważ tworzenie takich zbiorów danych wymaga ogromnej mocy obliczeniowej i jest bardzo kosztowne, a wiele istniejących zbiorów jest własnościowych i niedostępnych dla badaczy. Zbiór danych Meta zawiera około 110 milionów punktów danych i jest wielokrotnie większy od poprzednich.

Według ekspertów, otwarte udostępnienie tych danych jest nawet ważniejsze niż sam model AI i znacząco przyspieszy badania w dziedzinie nauki o materiałach, potencjalnie pomagając w tworzeniu lepszych baterii czy zrównoważonych paliw, choć sama firma Meta ma nadzieję wykorzystać te badania do obniżenia kosztów produkcji swoich okularów AR (w szczególności chodzi o alternatywę dla wykorzystywanego w Orionie węgliku krzemu (SiC) - https://www.reddit.com/r/augmentedreality/comments/1frdjt2/meta_orion_ar_glasses_the_first_deep_dive_into/ ).

• [5] Strach otworzyć lodówkę, bo wyskoczy z niej generator wideo
Genmo zaprezentowało Mochi 1, model open-source (z licencją Apache 2.0!) do generowania filmów z promptów. Firma twierdzi, że wydajność ich rozwiązania jest porównywalna lub przewyższa wiodących zamkniętych rywali.

Model 480p jest dostępny do użytku już dziś, a wersja o wyższej rozdzielczości ma pojawić się "jeszcze w tym roku".

Mochi 1 bazuje na nowatorskiej architekturze Asymmetric Diffusion Transformer (AsymmDiT). Architektura ta koncentruje się na rozumowaniu wizualnym, z czterokrotnie większą liczbą parametrów przeznaczonych do przetwarzania danych wideo w porównaniu do tekstu. Przy 10 miliardach parametrów jest to największy model generowania wideo typu open source.

• [6] A skoro o lodówce mowa - Allegro: Advanced Video Generation Model
W skrócie:
- 6-sekundowe filmy w 15 FPS z rozdzielczością 720x1280
- możliwość interpolacji do 30 FPS przy użyciu EMA-VFI.
- pełny open-source (z wagami i kodem) na Apache 2.0

• [7] Stability wypuściło wersję 3.5 modelu Stable Diffusion
I to aż w 3 wariantach. Pierwsze wrażenia? Po japońsku: jako-tako, choć anatomia postaci jest poprawiona. Poprawiona, nie naprawiona.

Tylko czy nie jest za późno? #flux1 założony przez byłych twórców SD skutecznie wdarł się na salony. SD 1.5 i SDXL wciąż są dobre w swoich niszach. Pony, które nie jest już tylko modyfikacją SD, świetnie sobie radzi z demokratyzacją sztuki, a przy tym nie jest ocenzurowany i generuje ładne baby anime.
Do pięknych artów jest midjourney i magnific (choć względnie drogie).

#ainews #sztucznainteligencja #gruparatowaniapoziomu #neurologia [1]

Odnośniki:
[1]
https://neurosciencenews.com/ai-genetics-psychiatry-27902/
https://www.cell.com/cell/abstract/S0092-8674(24)01032-8

[2]
https://www.bbc.com/news/articles/c2060gy9zy1o

[3]
https://www.marktechpost.com/2024/10/19/nvidia-ai-introduces-the-normalized-transformer-ngpt-a-hypersphere-based-transformer-achieving-4-20x-faster-training-and-improved-stability-for-llms/
https://arxiv.org/pdf/2410.01131

[4]
https://www.technologyreview.com/2024/10/18/1105880/the-race-to-find-new-materials-with-ai-needs-more-data-meta-is-giving-massive-amounts-away-for-free/

[5]
https://www.genmo.ai [klip wideo z samplami]
http://genmo.ai/play [demo, gdzie można sobie coś wygenerować]
https://venturebeat.com/ai/video-ai-startup-genmo-launches-mochi-1-an-open-source-model-to-rival-runway-kling-and-others/

[6]
https://huggingface.co/blog/RhymesAI/allegro [blog]
https://arxiv.org/abs/2410.15458 [praca naukowa]
https://huggingface.co/rhymes-ai/Allegro [HF]

[7]
https://huggingface.co/stabilityai/stable-diffusion-3.5-large-turbo

WH40K

23.10.2024, 05:54:07 via Wykop

@PeterWeiss: Jak tam walka z halucynacjami AI? :)

PeterWeiss

23.10.2024, 09:12:48 via Wykop

@WH40K: Było o tym w poprzednich newsach jeśli chcesz poczytać:
https://wykop.pl/wpis/78304207/codzienneainews-multimodalna-llama-3-2-tlumaczenia
https://wykop.pl/wpis/78459669/codzienneainews-llava-critic-llm-y-wiedza-wiecej-n
https://wykop.pl/wpis/78353133/codzienneainews-1-autogen-nowe-narzedzie-do-budowa
https://wykop.pl/wpis/78480351/codzienneainews-claude-z-trybem-batch-noble-za-sie

@PeterWeiss +9

#codzienneainews Multimodalna Llama 3.2; Tłumaczenia z lip sync; Narzędzie do korekty halucynacji LLMów; AI ocenia scenariusze; James Cameron w zarządzie Stability AI; asystent AI dla kierowców VW

• [1] Multimodalna Llama 3.2
Meta wprowadziła nową wersję swoich modeli Llama 3.2, które są teraz multimodalne. Modele Llama 3.2

Aktywne Wpisy

Aktywne Znaleziska

Deweloperiada to mapa wybranych praktyk patodeweloperskich na terenie Warszawy

Kraków pójdzie drogą Katowic? Radni chcą podatku od deweloperów

Sąd nakazał mu spłacić 240 tys. zł długu. "Odda za czterysta lat"

Piłkarze Legii Warszawa zostawili syf w szatni Cravovii i zniszczyli drzwi

Kupujesz mniej, płacisz tyle samo. Znikające gramy w czekoladzie

Popularne tagi