模型建议:关键字发现

问题描述

我想预测“重复”一词在演讲中的出现次数以及该词的大致持续时间。对于这项任务,我计划构建一个深度学习模型。我有大约 50 个正面和 50 个负面话语(我无法收集更多)。

最初我搜索了任何用于关键字识别的预训练模型,但没有找到一个好的。

然后我尝试了语音识别模型(深度语音),但它无法预测确切的重复词,因为我的数据遵循印度口音。此外,我认为为这项任务使用 ASR 模型将是一个过度杀伤的模型。

现在,我将整个音频分成 1 秒的块,重叠 50% 并在每个块中尝试二进制音频分类,即块是否包含“重复”一词.为了构建分类模型,我计算了 MFCC 特征并在其之上构建了一个序列模型。似乎没有什么对我有用。

如果有人已经处理过此类任务,请为我提供正确的方法/资源来为此任务构建 DL 模型。提前致谢!

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)