Wpis z mikrobloga

Transkrypcja audio

Mirki i Mirabelki, szczególnie jeżeli tworzycie treści video, jakieś podcasty a nawet tiktoki czy shorty na YT lub tłumaczenia z audio.
Jest takie ciekawe narzędzie do transkrypcji, projekt [Whisper]( https://github.com/openai/whisper) od OpenAI czyli od twórców ChatGPT, to musi być dobre!
No jest ale ma kosmiczne wymagania, projekt jest pythonie, z masą zależności i uj wie czego, normalnie kobyła.
Ktoś rozsądny wpadł na pomysł przepisania tego do C/C++ przez co powstała windowsowa apka i biblioteka o wadze 1MB :D
https://github.com/Const-me/Whisper/

Jakie są efekty takiego automatu?
Zerknijcie na przykładzie zapisu z live, gdzie live trwa ok 57 minut, a transkrypcja za pomocą w/w apki zajmuje 5 minut 57 sekund(Ryzen 7 5800X + RTX3070)
https://youtube.com/live/VtxKj2S2VV8

#technologia #transkrypcja #tlumaczenie #napisy #podcast #youtube #komputery
Pan_Slon - Transkrypcja audio

Mirki i Mirabelki, szczególnie jeżeli tworzycie treści...

źródło: whisperdesktop

Pobierz
  • 2
@Pan_Slon: No ale widać że trochę i tak trzeba samemu poprawiać jak choćby "closet source". Ale to i tak nieporównywalne do klepania tego wszystkiego ręcznie. ( ͡° ͜ʖ ͡°)