对有限数量的命令进行快速语音识别

有没有人有经验编程语音识别在C + +（Windows和/或Mac）针对SPEED的有限数量的命令？在这一点上，从第一个音节获得对命令的认可是否现实？即，当用户以合理快速的说话速度到达第二个音节时，命令被识别？所有的命令将被编程为从一个不同的音节开始，如果有必要，一个完全不同的音节（如“oo”，“xy”，“fay” – 只需要大约30个命令）。问过类似的问题，但这是一个快速发展的领域。最好的想法是寻找开源库还是与编译的实现接口？

如何在linux中使用麦克风以原始格式获取声音

在sapi中使用正确的语音识别时如何获得语音识别的蓝色框？

如何指定给定文本后面的内容是在sapi中的语法文件中的拼写听写？

无聊的人声识别

用于Windows中语音识别的自定义词汇表

我正在这个领域专业工作，我严重怀疑这是否是可能的。 C ++不是问题，问题是计算机是否允许。小声音片段的错误率很高，这是修复识别的隐马尔可夫模型。但在你的情况下，你根本无法提供足够的数据。

不是人类也可以做到这一点。语音处理并不像你的大脑让你相信的那样迅速。

您可以使用带Pocketsphinx解码器的CMUSphinx来做到这一点。

解码的部分假设在识别过程中是可用的，并且一旦发出就可以得到第一个音节。如果你给它0.1秒来稳定（对用户不可见），你将得到一个命令集的精确结果。

甚至还有专门为实时控制而设计的CMUSphinx顶端的工具，例如在游戏中，您可以检查InProTK及其演示。

对有限数量的命令进行快速语音识别

相关文章