Транскрибируйте речь в текст с помощью Python или Web Speech API.
питон
Убедитесь, что у вас установлен Python:
$ python --version
Рекомендуется Python версии 3.
Установите модуль SpeechRecognition
:
$ pip install SpeechRecognition
Создайте скрипт speech_to_text.py
, транскрибирующий аудиофайл Hello World.wav
в текст:
Запустить скрипт:
$ python speech_to_text.py
hello world
Библиотека
SpeechRecognition поддерживает следующие механизмы/API:
recognize_sphinx
(работает офлайн)recognize_google
recognize_wit
recognize_bing
recognize_api
recognize_houndify
recognize_ibm
Плюсы
- Бесплатно
- Довольно точно
Минусы
- Ограничения API (например, тайм-аут сети, слишком большой файл, ограничение скорости)
- Расшифровка может быть отключена
- Без знаков препинания
Смотрите Руководство для более подробной информации.
Демо
API веб-речи
Если аудиовход можно направить на ваш микрофон, то вы можете использовать JavaScript Web Speech API:
См. Демонстрация API Web Speech.
Эта статья была изначально опубликована на сайте замечательной марки.org 24 августа 2020 г.