Wpis z mikrobloga

@pawel86: Chyba wszystko oparte o Whisper AI, na iOS i macOS możesz pobrać sobie darmowe Aiko. Transkrybuje apliki audio i wideo, rozpoznaje język, działa na urządzeniu a nie w chmurze i ma opcję automatycznego tłumaczenia na angielski. Jakieś 3 miesiące temu autor apki zrobił downgrade modelu z V3 na V2, bo podobno jakość transkrypcji w V3 często była gorsza.
  • Odpowiedz
@sm_m: @pawel86: Z czego warto zaznaczyć, Whisper AI wspiera język polski, i jeżeli ma się komputer z dobrą kartą graficzną można to odpalić lokalnie za darmo.

https://github.com/openai/whisper

Bawiłem się tym na GTXie 1060 pod Windowsem i działało to w miarę przyzwoicie. Możliwe że na układach ARM od Apple'a będzie to działać bardzo porządnie. Tak, to nie jest łatwiutkie że klik w guziczek i gotowe, ale jest darmowe, a instrukcje jak
  • Odpowiedz
@supra107: No ta aplikacja o której wspominam wykorzystuje Whisper i jest to właśnie takie proste, robisz drag and drop pliku na okno programu i tyle (:
  • Odpowiedz
@sm_m: No wiadomo, chyba że ktoś zrobi frontend żeby tą straszną konsolę zamaskować to wtedy jest troszkę babrania się żeby to odpalić. ;)
  • Odpowiedz