Транскрибируйте речь в текст с помощью Python или Web Speech API.

питон

Убедитесь, что у вас установлен Python:

$ python --version

Рекомендуется Python версии 3.

Установите модуль SpeechRecognition:

$ pip install SpeechRecognition

Создайте скрипт speech_to_text.py, транскрибирующий аудиофайл Hello World.wav в текст:

Запустить скрипт:

$ python speech_to_text.py
hello world

Библиотека

SpeechRecognition поддерживает следующие механизмы/API:

  • recognize_sphinx (работает офлайн)
  • recognize_google
  • recognize_wit
  • recognize_bing
  • recognize_api
  • recognize_houndify
  • recognize_ibm

Плюсы

  • Бесплатно
  • Довольно точно

Минусы

  • Ограничения API (например, тайм-аут сети, слишком большой файл, ограничение скорости)
  • Расшифровка может быть отключена
  • Без знаков препинания

Смотрите Руководство для более подробной информации.

Демо

API веб-речи

Если аудиовход можно направить на ваш микрофон, то вы можете использовать JavaScript Web Speech API:

См. Демонстрация API Web Speech.

Эта статья была изначально опубликована на сайте замечательной марки.org 24 августа 2020 г.