Wpis z mikrobloga

A wiecie że istnieje coś takiego jak deepspeech (znając życie kto chciał wiedzieć to już dawno wie). Jest to darmowy system rozpoznawania mowy który działa offline, jednocześnie najmniej problemowy z tych z których próbowałem korzystać. Bez większych problemów działa na raspberry pi zero. Projekt jest rozwijany przez mozille a oprócz niego mają również coś takiego jak common voice gdzie każdy może pomóc w tworzeniu bazy dźwięków które to później mogą służyć do stworzenia polskiego modelu rozpoznawania mowy.

Obecnie jestem na etapie wyłączania serwera mówiąc głośno "shutdown server". Szukam lepszego mikrofonu by nie musieć krzyczeć i jakiegoś sytemu rozpoznawania do kogo należy głos.

Całość w środku korzysta z tenserflow i ma wyprowadzone api w wielu językach, choć chyba ludzie najczęściej korzystają z pythona. Da się tworzyć własne modele ale jeszcze się w to nie wczytałem.

Jakby ktoś miał jakieś ciekawe materiały na ten temat to chętnie poczytam.

Linki:
https://github.com/mozilla/DeepSpeech
https://commonvoice.mozilla.org/pl

#programowanie #uczeniemaszynowe #python