Wpis z mikrobloga

@McKeyPL: Pewnie wykorzystali skrypt DreamBoth który pozwala nauczyć model Stable Diffusion nowej postaci. Potrzebne jest do tego kilka obrazów danej postaci i kilka godzin pracy karty graficznej przy czym potrzebna jest karta graficzna z minimum 24 GB VRAM a konsumenckie RTX3080 mają maksymalnie po 12 GB. Lepiej jest skorzystać z GPU w chmurze i wtedy koszt za parę godzin pracy to kilkanaście dolarów.

Tutaj pewnie autorzy poszli trochę dalej i trenowali model na obrazach wielu różnych postaci + tagi przypisane do tych obrazów na e621.

Model "kinky" zna ponoć bardziej fetyszystyczne koncepcje takie jak macki, latex,
  • Odpowiedz
@McKeyPL: Tu jeszcze muszę wspomnieć że oryginalne Stable Diffusion nie radzi sobie z yiffem bo generuje futrzaki z ludzkim, łysym ciałem ( )
  • Odpowiedz
@AdireQ: wczoraj po powrocie z pracy postawiłem to sobie (omenomen też na 1080 xD) i no ci powiem ciekawe rzeczy wychodzą ale trzeba dobrze tagi mu dawać. No i jak dowali się rozdzielczość większą to brakuje mocy (i vramu ale to tylko powyżej 1600x1600).
  • Odpowiedz
@McKeyPL: Model "yiffy e18" na pewno zna tagi: spread_legs, pawpads i digitigrade. Połączenie tych tagów daje bardzo spójne obrazy. Nie mogę przestać klikać ( ʖ̯)
  • Odpowiedz
No i jak dowali się rozdzielczość większą to brakuje mocy (i vramu ale to tylko powyżej 1600x1600).


@McKeyPL: Którego modelu używasz? Bo u mnie przy rozdzielczości innej niż 512x512 obrazy wychodzą niespójne - ręce, nogi, głowy w losowych pozycjach.
  • Odpowiedz