Wpis z mikrobloga

Skopiuj link

01.10.2024, 08:18:25

Dropnął nowy model Whispera - Turbo. W skrócie: delikatnie zdegradowali swój największy model, aby działał 8 razy szybciej przy połowie rozmiaru (1500 -> 800 MB) i zmniejszyli zapotrzebowanie na VRAM z 10 GB do 6 GB (w porównaniu do -large)

Wreszcie nie trzeba będzie dziadować i wyłączać czego popadnie na kartach z małą ilością VRAM. Jak dla mnie jest to najlepsza wiadomość w tym tygodniu, bo często tego używam.

[ https://github.com/openai/whisper ]

Model Whisper to zaawansowane narzędzie do automatycznego rozpoznawania mowy (ASR) opracowane przez OpenAI. Jego głównym zadaniem jest przekształcanie mowy ludzkiej na tekst. Model ten został przeszkolony na ogromnych zbiorach danych głosowych, co pozwala mu osiągać wysoką dokładność w transkrypcji.

Whisper jest szczególnie ceniony za swoją zdolność do pracy z różnymi językami i akcentami, co czyni go wszechstronnym narzędziem do transkrypcji. Może być używany zarówno do transkrypcji w czasie rzeczywistym, jak i do przetwarzania wcześniej nagranych plików audio

#sztucznainteligencja #whisper #asr