#codzienneainews nowy Flux; AI w Notatniku; Ollama widzi; Jarvis istnieje

[1] Jeszcze lepszy Flux

Znane generator obrazów #flux1 został zaktualizowany do wersji FLUX 1.1 Pro Ultra (Max Plus Ultra Final v2 ;-) ). Teraz narzędzie obsługuje rozdzielczości do 4 megapikseli i jest znacznie szybsze - jeden obraz generuje się w zaledwie 10 sekund. Dodatkowo oferuje dwa tryby: "Ultra" i "Raw". Pierwszy tworzy obrazy w wysokiej rozdzielczości, a
PeterWeiss - #codzienneainews nowy Flux; AI w Notatniku; Ollama widzi; Jarvis istniej...

źródło: fofrA 01

Pobierz
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

@PeterWeiss: "baba z lasu" jak prawdziwa! To już chyba ten level gdzie może służyć do wyłudzania bloków od spermiarzy.
Mgławica rodem z galerii NASA. A gdyby nie bełkot w tekście to bym powiedział, że książka jest prawdziwa.
  • Odpowiedz
#codzienneainews newsy medyczne, o transformerach, zbiorach danych, lodówkach i innych generatorach

[1] SI odkrywa warianty DNA powiązane z zaburzeniami psychicznymi
Naukowcy ze Stanford opracowali nowe narzędzie SI o nazwie ARC-SV, które jest w stanie wykrywać złożone warianty strukturalne w ludzkim genomie z dokładnością 95%. Analizując ponad 4000 genomów z całego świata, algorytm zidentyfikował ponad 8000 różnych złożonych wariantów DNA, o długości od 200 do 100 000 par zasad. Wiele z
PeterWeiss - #codzienneainews newsy medyczne, o transformerach, zbiorach danych, lodó...

źródło: hc_dsn 03

Pobierz
  • 2
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 0
@PeterWeiss +9
#codzienneainews Multimodalna Llama 3.2; Tłumaczenia z lip sync; Narzędzie do korekty halucynacji LLMów; AI ocenia scenariusze; James Cameron w zarządzie Stability AI; asystent AI dla kierowców VW

[1] Multimodalna Llama 3.2
Meta wprowadziła nową wersję swoich modeli Llama 3.2, które są teraz multimodalne. Modele Llama 3.2
  • Odpowiedz
#codzienneainews Multimodalna Llama 3.2; Tłumaczenia z lip sync; Narzędzie do korekty halucynacji LLMów; AI ocenia scenariusze; James Cameron w zarządzie Stability AI; asystent AI dla kierowców VW

[1] Multimodalna Llama 3.2
Meta wprowadziła nową wersję swoich modeli Llama 3.2, które są teraz multimodalne. Modele Llama 3.2 11B i 90B potrafią analizować wykresy, opisywać obrazy oraz identyfikować obiekty na podstawie opisu. Mogą odpowiadać na pytania dotyczące np. map czy danych finansowych,
PeterWeiss - #codzienneainews Multimodalna Llama 3.2; Tłumaczenia z lip sync; Narzędz...

źródło: midjourney IterIntellectus GV51DHpakAAknPM

Pobierz
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

Po krótkiej, acz intensywnej walce udało mi się uruchomić FLUX1 na karcie 3070 8GB VRAM, chodzi to znośnie ok półtorej minuty na obrazek w modelu DEV z jedną LORĄ.
Mam pytanko czy podkręcając kartę mogę poprawić te wyniki, jeśli tak to co ma większe znaczenie dla szybkości generowania obrazków: prędkość rdzenia czy prędkość pamięci?
Aktualnie używam ConfyUI, czy jest to optymalne środowisko dla słabego sprzętu, czy też są programy, które sprawniej generują obrazy?
No i
Arystokrates - Po krótkiej, acz intensywnej walce udało mi się uruchomić FLUX1 na kar...

źródło: ComfyUI_00126_

Pobierz
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

#codzienneainews dziś: nowa realistyczna lora, generator muzyki, bagatelizowanie SI w sztuce
[1]
Nowa LoRA dla Flux - Boring Reality v2 umożliwia tworzenie stosunkowo realistycznych "zdjęć" jak to w komentarzu.
[2]
FluxMusic to nowy model text2music. Wykorzystuje on wiele wstępnie wyszkolonych koderów tekstu, aby zrozumieć podpowiedzi. Następnie stosuje mechanizmy uwagi zarówno do danych tekstowych, jak i muzycznych, a w kolejnym kroku udoskonala dźwięk za pomocą warstw tylko muzycznych. Model ma około
PeterWeiss - #codzienneainews dziś: nowa realistyczna lora, generator muzyki, bagatel...

źródło: 1725555801907.png_image

Pobierz
  • 1
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

#codzienneainews
#ai #ainews #flux1
"Model badawczy oparty na LLM nieoczekiwanie zmodyfikował swój kod, aby wydłużyć swój czas działania". Tylko jaki sposób jest to nieoczekiwane, że program napisany specjalnie w celu przepisania swojego kodu zaczyna to robić? Ponadto, jeśli chcesz, aby LLM edytował kod, musisz podawać mu każdą pojedynczą linię kodu w monicie. Czy to naprawdę takie dziwne, że dowiedziawszy się, że upłynął limit czasu, a
PeterWeiss - #codzienneainews
#ai #ainews #flux1
• "Model badawczy oparty na LLM nieo...

źródło: 1723976450725.png_image

Pobierz
  • 3
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 7
Porównanie bez lory i z lorą. Różnica jak między zdjęciem z photo stocka a fotką z rodzinnego albumu.

Prompt 1:

Amateur photography of three friends at an outdoor event in a city plaza. Casual, f/8, bright sunlight, noise, slight overexposure, high contrast, vivid colors, candid expressions, jpeg artifacts, on flickr in 2007, 2005 blog, 2007 blog <lora:amateurphoto:0>
Steps: 20, Sampler: Euler, Schedule type: Beta, CFG scale: 1, Distilled CFG Scale: 3.5, Seed:
PeterWeiss - Porównanie bez lory i z lorą. Różnica jak między zdjęciem z photo stocka...

źródło: q3oy1f6b8ajd1

Pobierz
  • Odpowiedz
#codzienneainews
#ai #ainews #flux1 [1]
Garść newsów dotyczących AI na dzień 2024-08-17:
Google udostępniło użytkownikom w USA najnowszą wersję Imagen oznaczoną numerem 3. Wg informacji producenta narzędzie ma generować obrazy z „lepszymi szczegółami, bogatszym oświetleniem i mniejszą liczbą rozpraszających artefaktów” w porównaniu do poprzednich modeli Google. Narzędzie odmawia generowania obrazów przedstawiających osoby publicznych, a także broni palnej. [1]

Prokuratura w San Francisco pozwała właścicieli 16 najczęściej
PeterWeiss - #codzienneainews
#ai #ainews #flux1 [1]
Garść newsów dotyczących AI na d...

źródło: GVIYr9kbgAA4-Xz

Pobierz
  • 2
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach

  • 4
Porównanie Imagen-3, Flux.1 i Dalle na szybko. Prompt:

In a prehistoric landscape, a group of dinosaurs stands frozen in a moment of collective realization, their massive forms dwarfed by the vastness of the sky above them. The scene is alive with detail—lush, verdant forests and towering trees surround them, while jagged mountains rise in the distance, shrouded in mist. The dinosaurs are a mix of species, with a towering Tyrannosaurus rex, a group
PeterWeiss - Porównanie Imagen-3, Flux.1 i Dalle na szybko. Prompt:

``
In a prehisto...

źródło: imagen flux dalle comparison

Pobierz
  • Odpowiedz
  • 0
@Flutter_M_Shydale: Po trochu zapewnie chodzi o wyciągnięcie kasy od rządu Kaliforni póki ej-aj jest na fali wznoszącej ;-)
Niemniej chodzi też o to, żeby ludzie dowiedzieli się co i jak się je z LLMami i innymi nowymi narzędziami. To coś w rodzaju naszych kursów komputerowych/internetowych dla dzieci i babć/dziadków organizowanych przez biblioteki, tylko bardziej zaawansowane.
  • Odpowiedz
Pojawił się to nowy model generatywnego AI nazwany FLUX.1. W przeciwieństwie do większości modeli text-to-image, które opierają się na dyfuzji, FLUX.1 wykorzystuje ulepszoną technikę zwaną "flow matching" ("dopasowaniem przepływu").

Podczas gdy modele dyfuzyjne tworzą obrazy poprzez stopniowe usuwanie szumu z losowego punktu początkowego, "dopasowywanie przepływu" przyjmuje bardziej bezpośrednie podejście, ucząc się precyzyjnych transformacji potrzebnych do przekształcenia szumu w realistyczny obraz. Ta różnica w metodologii skutkuje lepszą estetyką obrazów.

IMHO wypada
PeterWeiss - Pojawił się to nowy model generatywnego AI nazwany FLUX.1. W przeciwieńs...

źródło: fluxGUDVuVpW0AAJYWP

Pobierz
  • 8
  • Odpowiedz
  • Otrzymuj powiadomienia
    o nowych komentarzach