Wszystko
Najnowsze
Archiwum
1
Qwen3-TTS zmienia standardy syntezy i klonowania mowy

Informacja o udostępnieniu rodziny modeli Qwen3-TTS w formule open source błyskawicznie obiegła działy badawczo-rozwojowe oraz społeczność inżynierów uczenia maszynowego. Po raz pierwszy rynek otrzymał nie pojedyncze narzędzie, lecz kompletny ekosystem obejmujący projektowanie głosu (Voice Design),
z- 2
- #
- #
616
Klonowanie głosu (tylko angielski) Opad szczęki!!!

https://beta.elevenlabs.io/sign-up Przetestowałem. Spadłem z krzesła ;) Próbka 1 minuta i musi być mono.
z- 137
- #
- #
- #
Pojawił się nowy model TTS mogący również klonować głos (w tym polski)
https://huggingface.co/spaces/ResembleAI/Chatterbox-Multilingual-TTS
Po paru godzinach walki udało mi się go uruchomić LOKALNIE na CPU (mojej starej karty graficznej nie widział poprawnie).
Musiałem też przerobić interfejs www (na Flask), bo output na domyślnym Gradio nie pokazywał się (mimo, że sam plik generowało w tymczasowym katalogu). Dodałem też opcję wyboru jakości i
źródło: zoomit
PobierzLightning AI za darmo 30h miesięcznie
albo na hugginface sa najszybciej gotowe apki z nowymi modelami w /spaces