#codzienneainews Multimodalna Llama 3.2; Tłumaczenia z lip sync; Narzędzie do korekty halucynacji LLMów; AI ocenia scenariusze; James Cameron w zarządzie Stability AI; asystent AI dla kierowców VW

[1] Multimodalna Llama 3.2
Meta wprowadziła nową wersję swoich modeli Llama 3.2, które są teraz multimodalne. Modele Llama 3.2 11B i 90B potrafią analizować wykresy, opisywać obrazy oraz identyfikować obiekty na podstawie opisu. Mogą odpowiadać na pytania dotyczące np. map czy danych finansowych,
PeterWeiss - #codzienneainews Multimodalna Llama 3.2; Tłumaczenia z lip sync; Narzędz...

źródło: midjourney IterIntellectus GV51DHpakAAknPM

Pobierz
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

#codzienneainews Autonomiczny pojazd podwodny; SI dla statków kosmicznych; Znane głosy w Llama; Gemini w Snapchacie

[1] Autonomiczny pojazd podwodny do inspekcji morskich farm wiatrowych
Firma Beam wprowadziła pierwszy na świecie autonomiczny pojazd podwodny sterowany AI do inspekcji morskich farm wiatrowych. Technika ta została już zastosowana do kontroli konstrukcji wsporczych w największej szkockiej morskiej farmie wiatrowej Seagreen. Znacząco zwiększyła efektywność i zredukowała koszty inspekcji, skracając czas prac nawet o 50%. Beam
PeterWeiss - #codzienneainews Autonomiczny pojazd podwodny; SI dla statków kosmicznyc...

źródło: midjourney GXKQKVIa0AA-Os8

Pobierz
  • 4
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@PeterWeiss: klimatyczny obrazek!
Generowany, ale zajebiaszczy.

Projekt, finansowany przez instytucje takie jak ONR, NASA i ARL, ma na celu stworzenie robotów

Robot będzie mazzerował przez Poznań puszczając Konkwistę88 z głośnika bluetooth? ( ͡~ ͜ʖ ͡°)
  • Odpowiedz
#codzienneainews Sortowanie plików według ich treści; Produkcja chipów na pustyni; Meta RayBan niespodziewanym sukcesem; Altman, Jobs i Ive wchodzą w rynek sprzętu AI

[1] Sortowanie plików według ich treści
Pojawiło się interesujące narzędzie do automatycznego organizowania plików. Wykorzystuje otwarte modele takie jak Gemma-2-2B i LLaVa-v1.6 i nie wymaga połączenia z siecią, ani zewnętrznych API. Wszystko odbywa się lokalnie. Po skanie folderów Gemma-2-2B analizuje i podsumowuje pliki tekstowe generując odpowiednie opisy
PeterWeiss - #codzienneainews Sortowanie plików według ich treści; Produkcja chipów n...

źródło: midjourney GXwwfwsa8AAPWaP

Pobierz
  • 6
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 8
Bonus: Jak zapewne nie wiecie (spoko, ja też nie wiedziałem) niektóre kalkulatory są dozwolone na testach szkolnych w USA, o ile znajdują się na oficjalnej liście. Kalkulator Texas Instruments 84 jest jednym z powszechnie używanych przez uczniów. W podstawowej formie taki TI-84 średnio nadaje się do ściągania. Co więc zrobił jegomość z filmu? Zmodyfikował kalkulator, dodając moduł Wi-Fi, niestandardową płytkę drukowaną z regulatorem napięcia, napisał customowe applety i zapewnił mu dostęp do
PeterWeiss - Bonus: Jak zapewne nie wiecie (spoko, ja też nie wiedziałem) niektóre ka...
  • Odpowiedz
  • 1
@Worm91: Aspekty, o których wspominasz nie są bez znaczenia. Niemniej jeśli rzucisz wystarczająco dużą ilość petrodolarów na problem, to ten problem zniknie ;-)

Wg artykułu fabryki mają być w znacznym stopniu finansowane przez państwowy fundusz majątkowy (Abu Dhabi Mubadala), którego zadaniem jest finansowanie ekspansji krajowej produkcji półprzewodników. Więc chodzi tu mniej o względy czysto komercyjne (przynajmniej na początku), a bardziej o próbę zdywersyfikowania swojej gospodarki i wejścia w elektronikę. Jeśli
PeterWeiss - @Worm91:  Aspekty, o których wspominasz nie są bez znaczenia. Niemniej j...
  • Odpowiedz
#codzienneainews Poprawa rozumowania AI poprzez ponowne czytanie pytań; Zwiększenie wydajności SI dzięki "ekspertom" dla każdego rodzaju danych; Poprawa jakości odpowiedzi poprzez ćwiczenie i uczenie się na własnych błędach; Porównanie dostawców Llamy

[1] Poprawa rozumowania AI poprzez... ponowne czytanie pytań
Zdarza się wam czytać dwa razy to samo zadanie, żeby lepiej je zrozumieć? No to naukowcy z Google DeepMind doszli do bardzo ciekawych wniosków. Ich badanie zatytułowane "Powtórne czytanie poprawia rozumowanie
PeterWeiss - #codzienneainews Poprawa rozumowania AI poprzez ponowne czytanie pytań; ...

źródło: midjourney ultra_arcane GWjeSAGbgAAB2y2

Pobierz
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

#codzienneainews tworzenie gier promptami, roboty Disney'a uczą się tańca, nowe modele od Alibaby, inflacja

[1] Tworzenie gier promptami
Podczas Investor Day w NYC EA pokazało film koncepcyjny przedstawiający technologię "Imagination to Creation", opartą na SI, która mogłaby umożliwić tworzenie gier za pomocą komend głosowych.
Warto podkreślić, że póki co to tylko proof-of-concept dla inwestorów, a nie realne narzędzie. Choć przy tempie obecnego rozwoju AI kto wie, czy nie doczekamy się
PeterWeiss - #codzienneainews tworzenie gier promptami, roboty Disney'a uczą się tańc...

źródło: midjourney GW1CXjoa8AIy94t

Pobierz
  • 7
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 24
I bonus. W Teksasie doszło prawdopodobnie do najbardziej kuriozalnego zatrzymania przestępcy przez zdalnie sterowanego robota.

Kiedy negocjacje z uzbrojonym mężczyzną utknęły w martwym punkcie, oddział SWAT wysłał zdalnie sterowanego robota, który zazwyczaj jest używany do neutralizacji bomb.

Podejrzany próbował się bronić, zarzucając na niego prześcieradło, ale plan się nie powiódł — robot użył gazu łzawiącego, ściągnął przestępcy spodnie i przydusił go do ziemi.

https://streamable.com/hrt921
PeterWeiss - I bonus. W Teksasie doszło prawdopodobnie do najbardziej kuriozalnego za...
  • Odpowiedz
#codzienneainews elektrownia atomowa Microsoftu, usprawnienia robotów do codziennych czyności, asystent sprzedażowy oraz generator wideo od Amazon

[1] Elektrownia atomowa Microsoftu
W 2028 Microsoft uruchomi elektrownię atomową Three Mile Island. Firma chce w ten sposób pokryć zapotrzebowanie na energię w swoich centrach obliczeniowych.

[2] Usprawnienia robotów do codziennych czyności
PeterWeiss - #codzienneainews elektrownia atomowa Microsoftu, usprawnienia robotów do...

źródło: midjourney GXE5ulBaoAAOy1D

Pobierz
  • 3
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

#codzienneainews multimodalny LLM od Nvidii, MoE od Microsoftu, trenowanie generatorów wideo na filmach John Wick, inwestycja BlackRock i Microsoftu w AI

[1] Imponujący multimodalny LLM od Nvidii
NVLM 1.0 od Nvidii to rodzina nowoczesnych modeli językowych, które potrafią jednocześnie analizować obrazy i tekst, osiągając najlepsze wyniki w takich zadaniach. Rywalizują one z wiodącymi modelami, jak GPT-4o, a także z modelami dostępnymi za darmo, jak Llama 3-V 405B. Po treningu multimodalnym, NVLM
PeterWeiss - #codzienneainews multimodalny LLM od Nvidii, MoE od Microsoftu, trenowan...

źródło: midjourney GXXP5AYaQAAu_Ji

Pobierz
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

#codzienneainews przełomowy OCR, bezpłatne kursy Nvidii, nowy akcelerator AI od Meta oraz badanie w jakim stopniu LLMy zapamiętują dane treningowe

[1]
Kling dostanie nowe narzędzie w postaci "motion brush", dzięki któremu będzie można rysować wektory ruchu. Wideo w komentarzu.
[2]
Nowy model OCR o nazwie GOT (General OCR Theory) został opracowany jako przełomowe rozwiązanie w technologii rozpoznawania tekstu. GOT z 580 milionami parametrów oferuje jednolity system zdolny do rozpoznawania różnorodnych
PeterWeiss - #codzienneainews przełomowy OCR, bezpłatne kursy Nvidii, nowy akcelerato...

źródło: midjourneyj GXrfnMbaQAAyq0l

Pobierz
  • 2
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

#codzienneainews
[1] Narzędzie AI zmniejszyło liczbę zgonów w szpitalu o 26%?
Kanadyjski szpital St. Michael's wdrożył w 2020 r. na oddziale chorób wewnętrznych (GIM) w szpitalu, system wczesnego ostrzegania opartego na sztucznej inteligencji (CHARTwatch). System ten przewiduje pogorszenie stanu pacjenta w czasie rzeczywistym i wysyła alerty do lekarzy, pomagając zmniejszyć liczbę zgonów.

Praca badawcza opisująca CHARTwatch wskazuje również na wzrost stosowania antybiotyków i kortykosteroidów, co wskazuje na bardziej proaktywną opiekę nad
PeterWeiss - #codzienneainews
• [1] Narzędzie AI zmniejszyło liczbę zgonów w szpitalu...

źródło: GXe_lq_bwAA8ggi b

Pobierz
  • 3
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

#codzienneainews
[1]
Jensen Huang, CEO Nvidii twierdzi, że SI jest niezbędna w dzisiejszej grafice komputerowej. Zabawnie to brzmi z ust prezesa największej firmy sprzedającej akceleratory AI i karty graficzne, bo "hehe, nie poradzimy sobie bez DLSS, tak jasne xD".

Komentarze do tej wypowiedzi skupiają się na upscalingu, ale to, co jest ignorowane, to ogólny temat "renderowania neuronowego". Otóż wykorzystanie ML do upscalingu to drobnostka w porównaniu z badaniami nad modelami ML
PeterWeiss - #codzienneainews
• [1] 
Jensen Huang, CEO Nvidii twierdzi, że SI jest ni...

źródło: Alexandra Aisling aiart GXaFN6pWUAAZLjL

Pobierz
  • 2
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

#codzienneainews SI bez większego wpływu na wybory, tasker na bazie LLM, FSR4 bazuje na AI, klonowanie głosu Vadera

[1]
Naukowcy z Instytutu Alana Turinga przeanalizowali ponad 100 wyborów krajowych przeprowadzonych od 2023 r. i stwierdzili, że "tylko 19 z nich wykazało ingerencję sztucznej inteligencji". Ponadto dowody nie wykazały żadnych "wyraźnych oznak znaczących zmian w wynikach wyborów w porównaniu z oczekiwanymi wynikami kandydatów politycznych na podstawie danych sondażowych".

Autorzy argumentują, że
PeterWeiss - #codzienneainews SI bez większego wpływu na wybory, tasker na bazie LLM,...

źródło: tu sobie siade i bede siedzial GWla976XoAA67wi

Pobierz
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

#codzienneainews
[1]
Salesforce uruchomił Agentforce, platformę AI, która umożliwia klientom korporacyjnym tworzenie i wdrażanie niestandardowych agentów dla różnych potrzeb biznesowych.
Platforma integruje się z istniejącymi aplikacjami Salesforce i wymaga minimalnego kodowania. Dyrektor generalny Salesforce, Marc Benioff, postrzega to jako początek hybrydowej przyszłości, w której ludzie i agenci AI współpracują ze sobą. Niektóre firmy, takie jak ADP, OpenTable, Disney i Kaiser Permanente, już korzystają z Agentforce.
(Jeszcze 3 lata temu jak pracowałem
PeterWeiss - #codzienneainews
• [1] 
Salesforce uruchomił Agentforce, platformę AI, k...

źródło: 1725555370884.png_image

Pobierz
  • 2
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

#codzienneainews
[1]
Wyniki badań przeprowadzonych przez naukowców z MIT Sloan i Uniwersytetu Cornell sugerują, że SI w postaci chatbotów może być skutecznym narzędziem w walce z teoriami spiskowymi.

Badacze odkryli, że rozmowa z LLM na temat teorii spiskowej może zmniejszyć wiarę w nią o około 20%. I to nawet wśród osób, dla których te przekonania są ważne dla ich tożsamości.

Autorzy
PeterWeiss - #codzienneainews
• [1] 
Wyniki badań przeprowadzonych przez naukowców z ...

źródło: co dwie glowy to nie jedna GV_H_ueXMAAR_AM

Pobierz
  • 8
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

#codzienneainews dziś: samouczący się robo-pies na kołach, humanoidalne roboty w fabryce BMW, GENERATOR PODCASTÓW od Google i nowy model od OpenAI
[1]
Google NotebookLM ozwala on na przesłanie do 100 dokumentów, każdy do 200 000 słów i generowanie podsumowań, zapytań itp. Dokumenty można przeglądać i znajdować w nich kluczowe detale. Już samo to jest fajne, ale na dniach wydali niesamowitą aktualizację. Teraz Google NotebookLM może generować podcasty (z męskim i
PeterWeiss - #codzienneainews dziś: samouczący się robo-pies na kołach, humanoidalne ...

źródło: 1725414452614.png_image

Pobierz
PeterWeiss - #codzienneainews dziś: samouczący się robo-pies na kołach, humanoidalne ...
  • 5
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 6
Komentarz:
Dr Jim Fan, autor wpisu na X omawia model "Strawberry" (o1), który to wprowadza zmianę w podejściu do uczenia maszynowego, przesuwając nacisk z dużych modeli przedtrenowanych na optymalizację skalowania w czasie wnioskowania (inference). Podejście to odzwierciedla szerszy trend polegający na wykorzystaniu większej mocy obliczeniowej podczas wnioskowania, a nie tylko w fazie trenowania, co jest zgodne z ideą Richarda Suttona z The Bitter Lesson, która podkreśla, że jedynie uczenie i wyszukiwanie są technikami
PeterWeiss - Komentarz:
Dr Jim Fan, autor wpisu na X omawia model "Strawberry" (o1), ...

źródło: GXSkIaKbgAQrbJx

Pobierz
  • Odpowiedz
#codzienneainews multimodalny mistral, wycinarka obiektów, chatbot od dokumentów pańtwowych, jeszcze wydajniejszy Groq
[1]
Francuski Mistral opublikował swój pierwszy model, który może przetwarzać nie tylko tekst, ale i obrazy. Pixtral 12B jest do ściągnięcia z linków niżej.
[2]
Narzędzie Object Cutter pozwala na łatwe wycinanie obiektów z tła. Można to zrobić promptem pisząc co ma być wycięte, albo zaznaczając prostokątem. Działa całkiem nieźle jeśli obiekt jest w miarę odseparowany od tła
PeterWeiss - #codzienneainews multimodalny mistral, wycinarka obiektów, chatbot od do...

źródło: Zrzut ekranu 2024-09-12 052101

Pobierz
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

#codzienneainews dziś: oddzielanie wzorców mózgowych od innych aktywności mózgu, generatywne AI w Roblox, co dwa SLMy to nie jeden

[1]
Maryam Shanechi i jej zespół z USC opracowali nowy algorytm SI, DPAD (Dissociative Prioritized Analysis of Dynamics), który może oddzielić wzorce mózgowe związane z określonymi zachowaniami, takimi jak ruchy ramion, od innych jednoczesnych aktywności mózgu.

Technologia ta może ulepszyć interfejsy mózg-komputer (BCI), które pomagają sparaliżowanym pacjentom odzyskać ruch poprzez dekodowanie
PeterWeiss - #codzienneainews dziś: oddzielanie wzorców mózgowych od innych aktywnośc...

źródło: 1725554599629.png_image

Pobierz
  • 4
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 1
@CH3j: Niezbyt. Interfejsy mózg-komputer już od jakiegoś czasu wykorzystują sygnały bezpośrednio z mózgu, a nie tylko impulsy nerwowe lub mięśniowe. Kluczowa innowacja polega na sposobie przetwarzania i interpretacji tych sygnałów mózgowych. Wcześniej BCI borykały się z wieloma trudnościami.

Otóż mózg wytwarza złożone sygnały związane z wieloma jednoczesnymi czynnościami i myślami. Być może teraz sięgasz ręką po kubek kawy, czytasz na głos jakiś artykuł, abo komentarz na wykopie, a jednocześnie czujesz
PeterWeiss - @CH3j: Niezbyt. Interfejsy mózg-komputer już od jakiegoś czasu wykorzyst...

źródło: 41593_2024_1731_Tab1_ESM

Pobierz
  • Odpowiedz
  • 1
Nigdy nie generuje tego o co mi chodziło


@CH3j: Mam tak chyba z każdym generatorem obrazków dla chatbotów xD Generują mniej więcej coś zbliżonego do tego, co sobie wymyśliłem, o ile GPT wcześniej dopieści mojego prompta. Ale generalnie, jeśli coś ma wyglądać tak, jak sobie wymyśliłem, to dedykowany generator obrazu z obsługą ControlNet jest niezastąpiony.

Coś w ten deseń:
PeterWeiss - >Nigdy nie generuje tego o co mi chodziło

@CH3j: Mam tak chyba z każdym...
  • Odpowiedz
#codzienneainews dziś: nowa realistyczna lora, generator muzyki, bagatelizowanie SI w sztuce
[1]
Nowa LoRA dla Flux - Boring Reality v2 umożliwia tworzenie stosunkowo realistycznych "zdjęć" jak to w komentarzu.
[2]
FluxMusic to nowy model text2music. Wykorzystuje on wiele wstępnie wyszkolonych koderów tekstu, aby zrozumieć podpowiedzi. Następnie stosuje mechanizmy uwagi zarówno do danych tekstowych, jak i muzycznych, a w kolejnym kroku udoskonala dźwięk za pomocą warstw tylko muzycznych. Model ma około
PeterWeiss - #codzienneainews dziś: nowa realistyczna lora, generator muzyki, bagatel...

źródło: 1725555801907.png_image

Pobierz
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

#codzienneainews dziś: nadmierne zaufanie do autorytetu (tu SI), oczyszczanie skanów 3D modelami dyfuzyjnymi, generowanie realistycznych widoków 360

[1]
W symulowanych decyzjach dotyczących życia lub śmierci około dwie trzecie osób biorących udział w badaniu UC Merced zmieniło swoje decyzje po otrzymaniu porady od robota, mimo że wiedzieli, że sztuczna inteligencja jest niewiarygodna.

W badaniu symulowano sterowanie uzbrojonym dronem i poproszono uczestników o podjęcie decyzji, czy strzelać do celów, podczas gdy roboty
PeterWeiss - #codzienneainews dziś: nadmierne zaufanie do autorytetu (tu SI), oczyszc...

źródło: 1725557321316.png_image

Pobierz
  • 4
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 3
Prompt do "trójki" - generowania widoku 360:

I stand in the heart of a bustling medieval town, surrounded by cobblestone streets and timber-framed houses. The air is filled with the sounds of merchants hawking wares, the clang of a blacksmith’s hammer, and the scent of fresh bread. A stone castle looms in the distance, its flags fluttering in the breeze. Townsfolk bustle about, knights on horseback pass by, and a bard plays
PeterWeiss - Prompt do "trójki" - generowania widoku 360:
 I stand in the heart of a ...

źródło: 2024-09-07 235656

Pobierz
  • Odpowiedz