#codzienneainewsAsystenci laboratoryjni AI; SAP o regulacjach AI w EU; Poprawianie LLM-ów poprzez DPO; Aktualizacja Flux; OpenAI wprowadza Canvas
•[1] Asystenci laboratoryjni od Google i BioNTech Google DeepMind i BioNTech budują asystentów laboratoryjnych opartych na SI, aby pomóc naukowcom w planowaniu eksperymentów naukowych i lepszym przewidywaniu ich wyników. W międzyczasie BioNTech i jego spółka zależna InstaDeep zaprojektowały wyspecjalizowanego asystenta AI znanego jako Laila, zbudowanego na modelu open-source Llama 3.1 od
Nie no, wszystko przecież jasne. Stosując tradycyjne podejście, te oparte na SFT, czyli nadzorowanym dostrajaniu można by pomyśleć, że trychter był na szoner robiony i we flanszy jest culajtung i dałoby się zrobić na sam abszperwentyl, więc dałoby się bez holajzy lochbajtel krypować. Ale jakby zastosować metodę poprawy zdolności oceny LLM-ów poprzez bezpośrednią optymalizację preferencji osądów (DPO) to można zauważyć, że trychter jest robiony na szoner, nie zaś krajcowany i od
"Fisherman’s Bay, South Farallon Island" to jeden z bardziej znanych obrazów Hermanna Ottomara Herzoga, namalowany w 1875 roku. Dzieło przedstawia malowniczy widok na zatokę rybacką na Wyspach Farallońskich, które znajdują się u wybrzeży Kalifornii.
Obraz charakteryzuje się realistycznym stylem, typowym dla Herzoga, z dużą dbałością o detale i precyzyjnym oddaniem naturalnego światła. Na płótnie można dostrzec spokojne wody zatoki, otoczone skalistymi brzegami, a także łodzie rybackie, które dodają scenie życia i dynamiki. Kolorystyka
#codzienneainewsTranskrypcja audio lokalnie w przeglądarce; Model do rozmów głosowych; generatywne fukncje AI w MS Paint; Nowy algorytm RLHF od Meta
•[1] Transkrypcja audio lokalnie w przeglądarce Wcześniej pisałem, że OpenAI wydało nowy model Whisper - Turbo, a teraz można go sobie odpalić lokalnie w przeglądarce za pomocą transformers.js. Przed pierwszym odpaleniem zaciągane jest kilkaset MB, także trzeba chwilę poczekać. W Firefox trzeba dodatkowo zmienić wartość dom.workers.modules.enabled na true.
#codzienneainewsSI w kenijskim rolnictwie; LLM of Fujitsu; Diagnostyka AI; Już nigdy się nie zgubisz z Revisit Anything
•[1] Kenijscy rolnicy wykorzystują SI do zwiększenia plonów Drobni rolnicy w Kenii coraz częściej adoptują narzędzia oparte na SI, aby zwiększyć plony. Aplikacje takie jak Virtual Agronomist i PlantVillage pomagają rolnikom podejmować decyzje dotyczące stosowania nawozów i zwalczania szkodników. W artykule bliżej nieokreśleni naukowcy o strzegają przed nadmiernym poleganiem na tych narzędziach,
Dropnął nowy model Whispera - Turbo. W skrócie: delikatnie zdegradowali swój największy model, aby działał 8 razy szybciej przy połowie rozmiaru (1500 -> 800 MB) i zmniejszyli zapotrzebowanie na VRAM z 10 GB do 6 GB (w porównaniu do -large)
Wreszcie nie trzeba będzie dziadować i wyłączać czego popadnie na kartach z małą ilością VRAM. Jak dla mnie jest to najlepsza wiadomość w tym tygodniu, bo często tego używam.
#codzienneainewsTestowanie limitów skalowania o1-mini; Kalifornijska ustawa o AI zawetowana; Przystępna metoda analizy dokumentów; Pracownicy socjaln wykorzystują AI do "papierkowej roboty"
•[1] Testowanie limitów skalowania modelu o1-mini ChatGPT o1-mini uzyskuje lepsze wyniki w Amerykańskim Teście Matematycznym (AIME), gdy... poleceniem "myśl dłużej" każe mu się używać więcej tokenów.
Bonus: Runway w trybie video-to-video zamienia zwykłe łażenie po domu w eksplorację bazy w Fallout 3.
A teraz wyobraźcie sobie, że w przyszłości takie coś będzie można robić w czasie rzeczywistym mając na nosie okulary takie jak Orion od Mety. Aż przypominają się "Czarne Oceany" Dukaja i fajnie zaprezentowane tam "nakładki" na rzeczywistość. Tyle że tam wszczepki wytwarzają wizualne reprezentacje bezpośrednio w ośrodku wzroku w korze mózgu, z pominięciem narządów zmysłów, ale
#codzienneainews •[1] Llama Stack upraszcza tworzenie aplikacji agentowych Meta wydała Llama Stack, nowy interfejs API, upraszcza wdrażanie i dostosowywanie modeli Llama.
•[2] Emu3: Rewolucja w AI multimodalnym dzięki przewidywaniu kolejnego tokena AAI wypuściło model Emu3, który wykorzystuje przewidywanie kolejnego tokena do generowania obrazów, tekstu i wideo. W przeciwieństwie do tradycyjnych modeli opartych na złożonych metodach, takich jak modele dyfuzyjne (np. Stable Diffusion) lub modele kompozytowe (np. CLIP z LLM), Emu3
Bonus: Jak GTA: Vice City mogłoby wyglądać, gdyby zostało wydane w 2024 roku. Filmik powstał przy użyciu generatora Runway Gen 3 w trybie video-to-video.
#dungeonsynth w tolkienowskich klimatach Secret Stairways - Enchantment of the Ring (1997)
Secret Stairways był solowym projektem instrumentalnym Matthew P. Davisa (znanego również ze współpracy z Twelfth of Never, Faces of Bayon, Labyrintheory, Blackened Chapel i Tears ov Blood). Chłop poddał się w 2011 r. Requiescat in pace. https://youtu.be/XKSu-wZChcQ
#smiesznekotki kradnące jedzenie 8/13 Jean-Baptiste-Siméon Chardin -- Martwa natura z kotem i rybą (1728 r.)
"Martwa natura z kotem i rybą" to obraz namalowany przez Jean-Baptiste-Siméon Chardina w 1728 roku. Dzieło to jest przykładem jego mistrzostwa w przedstawianiu martwej natury, gdzie codzienne przedmioty nabierają niemalże poetyckiego wymiaru.
Obraz przedstawia kota, który z zainteresowaniem przygląda się rybom leżącym na kamiennym blacie. Scena jest pełna subtelnych detali, takich jak tekstura futra kota czy połysk
#codzienneainews •[1] LLM Compressor optymalizuje open-source'owe modele językowe LLM Compressor optymalizuje open-source'owe modele językowe, zwiększając ich szybkość i redukując koszty sprzętowe. Narzędzie to łączy m.in. activation quantization z weight quantization i sparse pruningiem, customowymi kernelami (CUTLASS) zbierając różne techniki kompresji zusammen do kupy w jednym frameworku. Do tego łatwo integruje się z HF i vLLMami.
•[2] MIMO: System do tworzenia realistycznych animacji postaci z kontrolą nad ruchami i sceną
Zaśmiane. Konteks: Marques Brownlee (MKBHD), znany z recenzji technologicznych, wrzucił na Apple App Store "Panels" - appkę z tapetami. Wysokie ceny ($12 miesięcznie za dostęp do tapet HD), problemy z prywatnością i nadmiar reklam w darmowej wersji sprawiły, że aplikacja otrzymała głównie jednogwiazdkowe oceny. [ https://www.news18.com/viral/when-reviewer-gets-reviewed-why-mkbhds-wallpaper-app-panels-got-1-star-rating-by-fans-9062446.html ] A dlaczego to zabawne? Bo jak widać umiejętność recenzowania nie zawsze przekłada się na zdolność tworzenia dobrych produktów. A do tego taką appkę najwyraźniej da się zrobić
Louis Gurlitt -- Widok na jezioro Nemi w Górach Albańskich w pobliżu Rzymu, (1874)
Louis Gurlitt, właściwie Heinrich Louis Theodor Gurlitt, urodził się 8 marca 1812 roku w Altonie (wówczas część Danii, obecnie Niemcy) i zmarł 19 listopada 1897 roku w Naundorfie w Saksonii. Był duńsko-niemieckim malarzem specjalizującym się w pejzażach.
Gurlitt studiował w Hamburgu pod kierunkiem Siegfrieda Detleva Bendixena, a następnie kontynuował naukę w Królewskiej Duńskiej Akademii Sztuk w Kopenhadze, gdzie otrzymał srebrny
#codzienneainewsAutonomiczny pojazd podwodny; SI dla statków kosmicznych; Znane głosy w Llama; Gemini w Snapchacie
•[1] Autonomiczny pojazd podwodny do inspekcji morskich farm wiatrowych Firma Beam wprowadziła pierwszy na świecie autonomiczny pojazd podwodny sterowany AI do inspekcji morskich farm wiatrowych. Technika ta została już zastosowana do kontroli konstrukcji wsporczych w największej szkockiej morskiej farmie wiatrowej Seagreen. Znacząco zwiększyła efektywność i zredukowała koszty inspekcji, skracając czas prac nawet o 50%. Beam
#codzienneainewsSortowanie plików według ich treści; Produkcja chipów na pustyni; Meta RayBan niespodziewanym sukcesem; Altman, Jobs i Ive wchodzą w rynek sprzętu AI
•[1] Sortowanie plików według ich treści Pojawiło się interesujące narzędzie do automatycznego organizowania plików. Wykorzystuje otwarte modele takie jak Gemma-2-2B i LLaVa-v1.6 i nie wymaga połączenia z siecią, ani zewnętrznych API. Wszystko odbywa się lokalnie. Po skanie folderów Gemma-2-2B analizuje i podsumowuje pliki tekstowe generując odpowiednie opisy
Bonus: Jak zapewne nie wiecie (spoko, ja też nie wiedziałem) niektóre kalkulatory są dozwolone na testach szkolnych w USA, o ile znajdują się na oficjalnej liście. Kalkulator Texas Instruments 84 jest jednym z powszechnie używanych przez uczniów. W podstawowej formie taki TI-84 średnio nadaje się do ściągania. Co więc zrobił jegomość z filmu? Zmodyfikował kalkulator, dodając moduł Wi-Fi, niestandardową płytkę drukowaną z regulatorem napięcia, napisał customowe applety i zapewnił mu dostęp do
@Worm91: Aspekty, o których wspominasz nie są bez znaczenia. Niemniej jeśli rzucisz wystarczająco dużą ilość petrodolarów na problem, to ten problem zniknie ;-)
Wg artykułu fabryki mają być w znacznym stopniu finansowane przez państwowy fundusz majątkowy (Abu Dhabi Mubadala), którego zadaniem jest finansowanie ekspansji krajowej produkcji półprzewodników. Więc chodzi tu mniej o względy czysto komercyjne (przynajmniej na początku), a bardziej o próbę zdywersyfikowania swojej gospodarki i wejścia w elektronikę. Jeśli
• [1] Asystenci laboratoryjni od Google i BioNTech
Google DeepMind i BioNTech budują asystentów laboratoryjnych opartych na SI, aby pomóc naukowcom w planowaniu eksperymentów naukowych i lepszym przewidywaniu ich wyników. W międzyczasie BioNTech i jego spółka zależna InstaDeep zaprojektowały wyspecjalizowanego asystenta AI znanego jako Laila, zbudowanego na modelu open-source Llama 3.1 od
źródło: aiart GXewjeHWYAEv1_i
PobierzNie no, wszystko przecież jasne. Stosując tradycyjne podejście, te oparte na SFT, czyli nadzorowanym dostrajaniu można by pomyśleć, że trychter był na szoner robiony i we flanszy jest culajtung i dałoby się zrobić na sam abszperwentyl, więc dałoby się bez holajzy lochbajtel krypować.
Ale jakby zastosować metodę poprawy zdolności oceny LLM-ów poprzez bezpośrednią optymalizację preferencji osądów (DPO)
to można zauważyć, że trychter jest robiony na szoner, nie zaś krajcowany i od