Wpis z mikrobloga

Dzień dobry Wykopowicze z tagu #sztucznainteligencja oraz #rvc

Chciałbym podzielić się z wami modelami głosowymi znanych osób w technologi RVC Tutaj Link do mojego profilu WeightsGG

Dziś wytrenowałem na swoim lokalnym PC 8 modeli głosowych w technologi AI Retrieval based voice conversion- Między innymi: Sławomir Mentzen, Mateusz Morawiecki, Janusz Panasewicz oraz Szymon z kanału Wojna Idei, na moim profilu weights.gg jest jeszcze wiele innych modeli.
Piszę wpis z powodu dużej aktywności i pytań związanych z AI Coverami / AI trainingiem modeli głosowych w technologi RVC v2, Więcej na temat samego procesu uczenia maszynowego i treningu modelu np. Pytorch pisałem tutaj pod wpisem anonimowego użytkownika mikrobloga.

Do treningu modeli używam systemu Linux i karty graficznej NVIDIA oraz platformy obliczeń równoległych CUDA, wszystkie modele są trenowane w technologi konwersji Mangio-Crepe 64 (Oprócz Panasewicza, on trenowany był w RMVPE) oraz mają po 500 Epchosów. Datasetem były nagrania 45min-3h, które dodatkowo wyciąłem przez UVR na patchu D1581+Voc_FT (Najlepszy Patch). Testowałem modele lokalnie na webconversionRVCgui i z własnego doświadczenia wiem, że model Tuska lepiej sobie radzi na niskich, "spokojnych" oraz "Normalnych" '' wokalach niż wysoko śpiewanych i ostro tonowanych.

Jeżeli chcecie możecie z poziomu przeglądarki wytestować modele, nie instalując niczego- Wystarczy założyć konto na weightsgg np za pomocą Google (WGG obsługuje również Discord oraz Microsoft Account). W bardziej zaawansowanej zabawie AI polecam GUI odpalane lokalnie w przeglądarce, które wymaga Pythona Link do WEBRVCGUI Polecam omijać inne GUI nieobsługujące Mangio-Crepe.

Jeśli chcecie widzieć więcej materiałów mojego autorstwa ze świata sztucznej inteligencji, możecie zaobserwować mój autorski tag - #aipyszczysko

  • 9
  • Odpowiedz
@AltCtrlSpace: Można wytrenować własny model- własnego głosu, jeśli masz odpowiedni sprzęt, który wspiera uczenie maszynowe. Jeśli nie dysponujesz takim sprzętem można w chmurze google collab lub podobnych usługach, ale tam raczej nie znajdziesz mangio-crepe a jedynie RMVPE . Wszystkie emocje i zachowywane są w pliku .index. w katalogu /logs po treningu modelu.

do czego to może być przydatne, do czego mogę to użyć


@AltCtrlSpace: AI covery oraz Dubbing i czytanie
  • Odpowiedz
@Lerguan: Tak da się zrobić głos RealTimeVoiceCloning ale wymaga to dość mocnego sprzętu, tym bardziej jeśli chcesz to robić w grze (chyba, że grasz przez stadie gfn lub inne cloud-gamingowe platformy) Szerzej opisane jest to w tym filmie z YouTube . Jeśli chcesz stworzyć własny model musisz mieć zainstalowane to webgui z GitHub i posiadać dobrej klasy sprzęt, ponieważ na słabym sprzęcie model może się trenować nawet bardzo wolno, zależy to
  • Odpowiedz