Model DALL-E 2 od OpenAI ma problemy z generowaniem spójnego tekstu na obrazkach. Ktoś wpadł na pomysł żeby wpisać te bełkotliwe słowa na wejście generatora i odkrył ciekawą zależność: wygląda to tak jakby te bełkotliwe słowa miały dla DALL-E 2 znaczenie.

Poniższy obraz został wygenerowany z frazy "rolnicy rozmawiają o swoich warzywach, z transkrypcją". Na obrazie jest dwóch rolników. Jeden z nich trzyma jakieś warzywa. Pojawia się też komiksowa chmurka z bełkotem
AdireQ - Model DALL-E 2 od OpenAI ma problemy z generowaniem spójnego tekstu na obraz...

źródło: comment_16545334445XvSqYtHKrir8fmvst6jnK.jpg

Pobierz
Wyobrażacie sobie jakiegoś poważnego człowieka z cywilizowanego kraju jedzącego #!$%@? polackiego pączka? xD
o #!$%@? wyobraźcie sobie jak taki James Bond #!$%@? je pączka xD bierze wielką kupę gówna z tłuszczem do mordy, lukier mu się kruszy na garnitur, #!$%@? mu rękaw, dżem z środka się wylewa, nie panuje nad tym, musi szybko #!$%@?ć, bo się pączek cały #!$%@? xD
a Donuta? Donuta zje sobie na spokojnie, małymi gryzami, wygląda jak człowiek
JanuszPawlacz7 - Wyobrażacie sobie jakiegoś poważnego człowieka z cywilizowanego kraj...

źródło: comment_1654458073i32B0jXaeRz4IYiaKTiiJZ.jpg

Pobierz
@martinlubpl: BTW: Google jest słabe w PR. OpenAI dało dostęp do DALL-E wyselekcjonowanym celebrytom którzy publikują co jakiś czas nowe obrazy co sprawia wrażenie zaangażowanej społeczności. GoogleAI ograniczyło się do tego że dwóch ich pracowników wrzuca na przemian losowe generacje. Poza tym nazwa "DALL-E" jest unikalna a "imagen" to chyba "obrazek" po hiszpańsku przez co posty GoogleAI mieszają się z losowymi tagami ;).
@mizantrol: Na razie nie użyjesz bo nie ma nawet zapisów do kolejki. Jest tylko publikacja i strona demonstracyjna. Aż dziwne że minęło 15 godzin a Google nie pochwaliło się tym ani w mediach społecznościowych ani na swoim blogu.