如何在 Python 中使用语音识别处理嘈杂的记录

问题描述

我正在使用“speech_recognition”将记录转换为文本。实际上，我的代码适用于“清除”记录。

import speech_recognition as sr
audioFile=("payload1.wav")
r = sr.Recognizer()
with sr.AudioFile(AUdio_FILE) as source:
audio = r.record(source)
print(r.recognize_google(audio))

我有一些以嘈杂声音开头的唱片，但后来变得清晰。当我想转换嘈杂的记录时，出现错误：

Audio file Could not be read as PCM WAV,aifF/aifF-C,or Native FLAC; check if file is corrupted or 
in another format

如果我用 Audacity（一个编辑记录的程序）剪掉它的嘈杂部分它有效

如何确定 Python 中的噪声部分？

例如；我想检测并剪切 100 到 200 频率之间的记录部分。

提前致谢。

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

python-sounddevice speech speech-recognition