
Транскрибируйте речь в текст с помощью Python или Web Speech API.
питон
Убедитесь, что у вас установлен Python:
$ python --version
Рекомендуется Python версии 3.
Установите модуль SpeechRecognition:
$ pip install SpeechRecognition
Создайте скрипт speech_to_text.py, транскрибирующий аудиофайл Hello World.wav в текст:
Запустить скрипт:
$ python speech_to_text.py
hello world
Библиотека
SpeechRecognition поддерживает следующие механизмы/API:
recognize_sphinx(работает офлайн)recognize_googlerecognize_witrecognize_bingrecognize_apirecognize_houndifyrecognize_ibm
Плюсы
- Бесплатно
- Довольно точно
Минусы
- Ограничения API (например, тайм-аут сети, слишком большой файл, ограничение скорости)
- Расшифровка может быть отключена
- Без знаков препинания
Смотрите Руководство для более подробной информации.
Демо
API веб-речи
Если аудиовход можно направить на ваш микрофон, то вы можете использовать JavaScript Web Speech API:

См. Демонстрация API Web Speech.
Эта статья была изначально опубликована на сайте замечательной марки.org 24 августа 2020 г.