本文將介紹如何使用Python讀取語音流。
首先,我們需要使用pyaudio庫進行錄音。
import pyaudio
p = pyaudio.PyAudio()
stream = p.open(format=FORMAT,
channels=CHANNELS,
rate=RATE,
input=True,
frames_per_buffer=CHUNK_SIZE)
以上代碼將打開一個音頻流,可以使用pyaudio庫的get_format_from_width、get_sample_size和paInt16函數獲取音頻流相關參數。
接下來,我們可以使用speech_recognition庫進行語音識別,如下:
import speech_recognition as sr
r = sr.Recognizer()
with sr.Microphone() as source:
print("請開始說話...")
audio = r.listen(source)
try:
print("識別結果為:" + r.recognize_google(audio, language="zh-CN"))
except sr.UnknownValueError:
print("語音無法識別。")
except sr.RequestError as e:
print("語音識別服務出現錯誤: {0}".format(e))
以上代碼將使用麥克風進行錄音并進行語音識別,最終輸出識別結果。需要注意的是,要使用識別服務,需要先進行安裝,具體可以參考speech_recognition庫的官方文檔。
上一篇gis json 矢量
下一篇mysql刪除視圖某一行