如何在 Python 中使用语音识别处理嘈杂的记录

问题描述

我正在使用“speech_recognition”将记录转换为文本。 实际上,我的代码适用于“清除”记录。

import speech_recognition as sr
audioFile=("payload1.wav")
r = sr.Recognizer()
with sr.AudioFile(AUdio_FILE) as source:
audio = r.record(source)
print(r.recognize_google(audio))

我有一些以嘈杂声音开头的唱片,但后来变得清晰。 当我想转换嘈杂的记录时,出现错误

Audio file Could not be read as PCM WAV,aifF/aifF-C,or Native FLAC; check if file is corrupted or 
in another format

如果我用 Audacity(一个编辑记录的程序)剪掉它的嘈杂部分 它有效

如何确定 Python 中的噪声部分?

例如;我想检测并剪切 100 到 200 频率之间的记录部分。

提前致谢。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)