Wpis z mikrobloga

#codzienneainews newsy medyczne, o transformerach, zbiorach danych, lodówkach i innych generatorach

[1] SI odkrywa warianty DNA powiązane z zaburzeniami psychicznymi
Naukowcy ze Stanford opracowali nowe narzędzie SI o nazwie ARC-SV, które jest w stanie wykrywać złożone warianty strukturalne w ludzkim genomie z dokładnością 95%. Analizując ponad 4000 genomów z całego świata, algorytm zidentyfikował ponad 8000 różnych złożonych wariantów DNA, o długości od 200 do 100 000 par zasad. Wiele z tych wariantów znajduje się w regionach genomu odpowiedzialnych za rozwój i funkcjonowanie mózgu.

Badacze wykorzystali to odkrycie do zbadania związków między tymi wariantami a chorobami psychicznymi, szczególnie schizofrenią i chorobą dwubiegunową. Analiza próbek tkanek mózgowych od ponad 100 osób (zarówno zdrowych, jak i chorych) wykazała, że zidentyfikowane warianty często pokrywają się z regionami genomu wcześniej powiązanymi z ryzykiem rozwoju tych chorób. Co więcej, warianty te wpływają na ekspresję pobliskich genów, co sugeruje ich bezpośredni udział w rozwoju chorób psychicznych i otwiera nowe możliwości w zakresie zrozumienia i leczenia tych schorzeń. Poprzednie metody te związki przeoczyły.

[2] Narzędzie AI pomoże wykryć złamania i pęknięcia kości
Narodowy Instytut Zdrowia i Opieki (NICE) w Wielkiej Brytanii planuje rekomendować cztery narzędzia AI do użytku w pilnej opiece zdrowotnej, które mają wspierać pracowników medycznych, przyspieszać diagnozę i zmniejszać potrzebę powtórnych wizyt. Jedno z narzędzi ma pomóc lekarzom w wykrywaniu złamań na zdjęciach rentgenowskich. Wg aktualnych danych aż w 3-10% przypadków medycy nie zauważają złamanych lub pękniętych kości. "Asystent" nie będzie działać samodzielnie - obrazy zawsze będą przeglądane przez specjalistę.

[3] Nowatorska architektura sieci neuronowych
Naukowcy z NVIDIA stworzyli nową architekturę LLM nazwaną nGPT, która działa znacznie wydajniej dzięki specjalnemu sposobowi normalizacji danych na hipersferze. W porównaniu do standardowego GPT, nowy model potrzebuje od 4 do 20 razy mniej czasu na trening i osiąga lepsze wyniki, szczególnie przy analizie dłuższych tekstów.

[4] Meta udostępnia ogromny zbiór danych dla SI
Meta udostępniła za darmo ogromny zbiór danych i modele AI nazwane Open Materials 2024 (OMat24), które mają przyspieszyć odkrywanie nowych materiałów. Jest to znaczący krok naprzód, ponieważ tworzenie takich zbiorów danych wymaga ogromnej mocy obliczeniowej i jest bardzo kosztowne, a wiele istniejących zbiorów jest własnościowych i niedostępnych dla badaczy. Zbiór danych Meta zawiera około 110 milionów punktów danych i jest wielokrotnie większy od poprzednich.

Według ekspertów, otwarte udostępnienie tych danych jest nawet ważniejsze niż sam model AI i znacząco przyspieszy badania w dziedzinie nauki o materiałach, potencjalnie pomagając w tworzeniu lepszych baterii czy zrównoważonych paliw, choć sama firma Meta ma nadzieję wykorzystać te badania do obniżenia kosztów produkcji swoich okularów AR (w szczególności chodzi o alternatywę dla wykorzystywanego w Orionie węgliku krzemu (SiC) - https://www.reddit.com/r/augmentedreality/comments/1frdjt2/meta_orion_ar_glasses_the_first_deep_dive_into/ ).

[5] Strach otworzyć lodówkę, bo wyskoczy z niej generator wideo
Genmo zaprezentowało Mochi 1, model open-source (z licencją Apache 2.0!) do generowania filmów z promptów. Firma twierdzi, że wydajność ich rozwiązania jest porównywalna lub przewyższa wiodących zamkniętych rywali.

Model 480p jest dostępny do użytku już dziś, a wersja o wyższej rozdzielczości ma pojawić się "jeszcze w tym roku".

Mochi 1 bazuje na nowatorskiej architekturze Asymmetric Diffusion Transformer (AsymmDiT). Architektura ta koncentruje się na rozumowaniu wizualnym, z czterokrotnie większą liczbą parametrów przeznaczonych do przetwarzania danych wideo w porównaniu do tekstu. Przy 10 miliardach parametrów jest to największy model generowania wideo typu open source.

[6] A skoro o lodówce mowa - Allegro: Advanced Video Generation Model
W skrócie:
- 6-sekundowe filmy w 15 FPS z rozdzielczością 720x1280
- możliwość interpolacji do 30 FPS przy użyciu EMA-VFI.
- pełny open-source (z wagami i kodem) na Apache 2.0

[7] Stability wypuściło wersję 3.5 modelu Stable Diffusion
I to aż w 3 wariantach. Pierwsze wrażenia? Po japońsku: jako-tako, choć anatomia postaci jest poprawiona. Poprawiona, nie naprawiona.

Tylko czy nie jest za późno? #flux1 założony przez byłych twórców SD skutecznie wdarł się na salony. SD 1.5 i SDXL wciąż są dobre w swoich niszach. Pony, które nie jest już tylko modyfikacją SD, świetnie sobie radzi z demokratyzacją sztuki, a przy tym nie jest ocenzurowany i generuje ładne baby anime.
Do pięknych artów jest midjourney i magnific (choć względnie drogie).

#ainews #sztucznainteligencja #gruparatowaniapoziomu #neurologia [1]

Odnośniki:
[1]
https://neurosciencenews.com/ai-genetics-psychiatry-27902/
https://www.cell.com/cell/abstract/S0092-8674(24)01032-8

[2]
https://www.bbc.com/news/articles/c2060gy9zy1o

[3]
https://www.marktechpost.com/2024/10/19/nvidia-ai-introduces-the-normalized-transformer-ngpt-a-hypersphere-based-transformer-achieving-4-20x-faster-training-and-improved-stability-for-llms/
https://arxiv.org/pdf/2410.01131

[4]
https://www.technologyreview.com/2024/10/18/1105880/the-race-to-find-new-materials-with-ai-needs-more-data-meta-is-giving-massive-amounts-away-for-free/

[5]
https://www.genmo.ai [klip wideo z samplami]
http://genmo.ai/play [demo, gdzie można sobie coś wygenerować]
https://venturebeat.com/ai/video-ai-startup-genmo-launches-mochi-1-an-open-source-model-to-rival-runway-kling-and-others/

[6]
https://huggingface.co/blog/RhymesAI/allegro [blog]
https://arxiv.org/abs/2410.15458 [praca naukowa]
https://huggingface.co/rhymes-ai/Allegro [HF]

[7]
https://huggingface.co/stabilityai/stable-diffusion-3.5-large-turbo
PeterWeiss - #codzienneainews newsy medyczne, o transformerach, zbiorach danych, lodó...

źródło: hc_dsn 03

Pobierz
  • 2
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 0
@PeterWeiss +9
#codzienneainews Multimodalna Llama 3.2; Tłumaczenia z lip sync; Narzędzie do korekty halucynacji LLMów; AI ocenia scenariusze; James Cameron w zarządzie Stability AI; asystent AI dla kierowców VW

[1] Multimodalna Llama 3.2
Meta wprowadziła nową wersję swoich modeli Llama 3.2, które są teraz multimodalne. Modele Llama 3.2
  • Odpowiedz