Wpis z mikrobloga

#codzienneainews dziś: inne podejście do sieci neuronowych, generator komiksów, nowy generator wideo i muzyki, koloryzator czarno-białych zdjęć

[1]
Naukowcy z Microsoft Research Asia zaprezentowali CircuitNet, sieć neuronową inspirowaną architekturą obwodów neuronowych mózgu.

W przeciwieństwie do tradycyjnych sieci neuronowych, które mają prostsze połączenia, CircuitNet naśladuje złożoną strukturę mózgu, w której neurony są gęsto połączone w niektórych obszarach i słabo w innych. Taka konstrukcja sprawia, że ta sieć neuronowa lepiej radzi sobie z różnymi zadaniami, takimi jak klasyfikacja obrazów, uczenie ze wzmocnieniem i prognozowanie szeregów czasowych.

Dzięki temu CircuitNet może wydajniej przetwarzać informacje i osiągać lepsze wyniki niż starsze modele, takie jak MLP, CNN i transformatory, zużywając przy tym mniej zasobów.

[2]
Anifusion udostępniło przyjazną dla użytkownika funkcję tworzenia komiksów za pomocą SI. Po zapoznaniu się z podstawami tworzenie paneli komiksowych jest dość proste. No prawie. Jest trochę jak z generatorami obrazów - trzeba mieć pomysł i wiedzieć jak go przelać na ekran. Jest łatwiej jeśli zna się tagi/prompty Danbooru. Krótkie wideo zamieściłem w komentarzu.

Do generowania treści podobnych do tych co na świętej pamięci nHentai.net niestety nie nadaje się: "Failed to generate image. Error: NSFW prompt detected. Please adjust your prompt!"

[3]
Pojawił się nowy chiński model text2video - MiniMax od Hailuoai. Jest za darmo, bez rejestracji, babrania w discordy. Zarzuciłem mu prosty prompt:

Zbliżenie na parującą filiżankę kawy na drewnianym stole, ze światłem słonecznym delikatnie wpadającym przez okno w tle. Kamera powoli przesuwa się w górę, ukazując spokojną poranną scenę na zewnątrz - ptaki latające po niebie i liście szeleszczące na delikatnym wietrze.


Efekt 9/10. Polecam.

Generują również darmową muzykę, acz bez szału. Choć może to przez brak skilla i tego, że słoń mi na ucho nadepnął. Albo dlatego, że Suno i Udio robią to lepiej.

[4]
Pojawiło się fajne narzędzie do kolorowania czarno-białych obrazów przy pomocy promptów. Projekt ten wykorzystuje Stable Diffusion (SDXL/SDXL-Light) i model opisowey BLIP (Bootstrapping Language-Image Pre-training). Nazywa się "text-guided-image-colorization".
"Użytkownicy mogą kontrolować generowane kolory obiektów na obrazach, dzięki czemu proces kolorowania jest bardziej spersonalizowany i kreatywny."
W skrócie: narzędzie może samo próbować odgadnąć kolory na cz-b zdjęciu, albo możesz sam/a opisać co jest na zdjęciu i jak ma wyglądać. Jeśli na zdjęciu jest kot z czapką na głowie to możesz określić kolor czapki i na taki zostanie pokolorowana. Kolor kota też.

#ai #ainews #sztucznainteligencja
PeterWeiss - #codzienneainews dziś: inne podejście do sieci neuronowych, generator ko...

źródło: GWjj_XbWYAcoH9S

Pobierz
  • 6
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 2
Prompt do "trójki" i wygenerowane wideo.

A close-up of a steaming cup of coffee on a wooden table, with sunlight gently filtering through a window in the background. The camera slowly pans upward, revealing a peaceful morning scene outside—birds flying across the sky as leaves rustle in a soft breeze.

[ https://streamable.com/vjsaex ]
PeterWeiss - Prompt do "trójki" i wygenerowane wideo.

A close-up of a steaming cup o...
  • Odpowiedz