Wpis z mikrobloga

@karololo: czy to oznacza, że branża lektorów zostanie zrewolucjonizowana? Powstaną biblioteki z głosami danych lektorów i zamiast zatrudniać osobę, będzie się kupować plik z jej głosem. A gdyby tej inteligencji puścić nagranie z przemówienia np. Trumpa to nauczy się mówić jego głosem. Nie wiem co Ci naukowcy chcą osiągnąć, moim zdaniem przesadzają :/
  • Odpowiedz
@bzduraa: To dość stara wiedza, ale czytałem kiedyś, że żeby dostać nowy głos ludzie z Ivony musieli dostać od lektora godziny próbek głosu, z których potem ręcznie wycinali interesujące ich fragmenty, z których potem byli w stanie złożyć dowolne zdanie.
Jeśli nie wydarzyła się rewolucja w zrozumieniu mowy, to jedyna czynność, którą da się tu zautomatyzować to automatyczne wyszukiwanie tych "fragmentów" w próbkach dźwięku - więc żeby uzyskać realistyczną symulację
  • Odpowiedz
Jeśli nie wydarzyła się rewolucja w zrozumieniu mowy


@sredni_szu: Rewolucji w zrozumieniu mowy nie ma. Ale automaty są w stanie (nie rozumiejąc co czytają i czemu) zacząć naśladować żywych ludzi na podstawie ich głosu ucząc się wydawać dźwięki ich głosem, właściwym tonem itd.

Były przecież chyba nawet deep fake video gdzie Obama/Trump mówili rzeczy których nie mówili.
  • Odpowiedz
@Rub3n: Ale w zrozumieniu mechanizmów mowy (nie zamiany mowy na tekst) czy w automatyzacji wyszukiwania składowych części? Bo za rewolucję w zrozumieniu mowy uważałbym sytuację, w której do zbudowania wiarygodnego modelu mowy danego człowieka potrzeba byłoby o co najmniej rząd wielkości mniej nagrań niż obecnie - o ile taka sytuacja w ogóle jest możliwa
  • Odpowiedz