如何在 Python 中使用语音识别处理嘈杂的记录

问题描述

我正在使用“speech_recognition”将记录转换为文本。 实际上,我的代码适用于“清除”记录。

import speech_recognition as sr
audioFile=("payload1.wav")
r = sr.Recognizer()
with sr.AudioFile(AUdio_FILE) as source:
audio = r.record(source)
print(r.recognize_google(audio))

我有一些以嘈杂声音开头的唱片,但后来变得清晰。 当我想转换嘈杂的记录时,出现错误

Audio file Could not be read as PCM WAV,aifF/aifF-C,or Native FLAC; check if file is corrupted or 
in another format

如果我用 Audacity(一个编辑记录的程序)剪掉它的嘈杂部分 它有效

如何确定 Python 中的噪声部分?

例如;我想检测并剪切 100 到 200 频率之间的记录部分。

提前致谢。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...