075. 编写一个函数,实现简单的语音识别功能
- 075. 编写一个函数,实现简单的语音识别功能
-
- 安装依赖库
- 示例代码
-
- 代码说明
- 示例输出
- 注意事项
- 使用 PocketSphinx 进行离线语音识别
-
- 注意事项
- 实现方法
-
- 使用SpeechRecognition库实现语音识别
- 使用PyAudio和深度学习模型
- 使用Vosk离线识别引擎
- 使用百度语音API实现云端识别
- 使用Whisper模型实现转录
075. 编写一个函数,实现简单的语音识别功能
在 Python 中,可以使用 SpeechRecognition
库来实现简单的语音识别功能。SpeechRecognition
是一个流行的语音识别库,支持多种语音识别引擎,包括 Google Web Speech API(在线)和本地引擎(如 PocketSphinx)。
使用 Google Web Speech API 来识别语音。
安装依赖库
在开始之前,请确保你已经安装了 SpeechRecognition
库。如果没有安装,可以通过以下命令安装:
pip install SpeechRecognition
如果你需要使用本地引擎(如 PocketSphinx),还需要安装 pocketsphinx
:
pip install pocketsphinx
示例代码
以下代码实现了一个简单的语音识别函数,使用 Google Web Speech API 识别语音。
import speech_recognition as srdef simple_speech_recognition():# 创建一个 Recognizer 对象recognizer = sr.Recognizer()# 使用麦克风作为音频源with sr.Microphone() as source:print("请说话...")audio = recognizer.listen(source) # 录制音频try:# 使用 Google Web Speech API 进行语音识别text = recognizer.recognize_google(audio, language="zh-CN") # 指定语言为中文print(f"您说的是: {text}")except sr.UnknownValueError:print("无法识别语音")except sr.RequestError as e:print(f"请求错误: {e}")# 示例用法
if __name__ == "__main__":simple_speech_recognition()
代码说明
创建 Recognizer 对象:使用 speech_recognition.Recognizer()
创建一个识别器对象。
使用麦克风录制音频:
-
使用
sr.Microphone()
作为音频源。 -
使用
recognizer.listen(source)
录制音频。
语音识别:
-
使用
recognizer.recognize_google(audio, language="zh-CN")
调用 Google Web Speech API 进行语音识别。 <