对有限数量的命令进行快速语音识别

有没有人有经验编程语音识别在C + +(Windows和/或Mac)针对SPEED的有限数量的命令? 在这一点上,从第一个音节获得对命令的认可是否现实?即,当用户以合理快速的说话速度到达第二个音节时,命令被识别? 所有的命令将被编程为从一个不同的音节开始,如果有必要,一个完全不同的音节(如“oo”,“xy”,“fay” – 只需要大约30个命令)。 问过类似的问题,但这是一个快速发展的领域。 最好的想法是寻找开源库还是与编译的实现接口?

如何在linux中使用麦克风以原始格式获取声音

在sapi中使用正确的语音识别时如何获得语音识别的蓝色框?

如何指定给定文本后面的内容是在sapi中的语法文件中的拼写听写?

无聊的人声识别

用于Windows中语音识别的自定义词汇表

我正在这个领域专业工作,我严重怀疑这是否是可能的。 C ++不是问题,问题是计算机是否允许。 小声音片段的错误率很高,这是修复识别的隐马尔可夫模型。 但在你的情况下,你根本无法提供足够的数据。

不是人类也可以做到这一点。 语音处理并不像你的大脑让你相信的那样迅速。

您可以使用带Pocketsphinx解码器的CMUSphinx来做到这一点。

解码的部分假设在识别过程中是可用的,并且一旦发出就可以得到第一个音节。 如果你给它0.1秒来稳定(对用户不可见),你将得到一个命令集的精确结果。

甚至还有专门为实时控制而设计的CMUSphinx顶端的工具,例如在游戏中,您可以检查InProTK及其演示。

相关文章

### 创建一个gRPC服务项目(grpc服务端)和一个 webapi项目(...
一、SiganlR 使用的协议类型 1.websocket即时通讯协议 2.Ser...
.Net 6 WebApi 项目 在Linux系统上 打包成Docker镜像,发布为...
一、 PD简介PowerDesigner 是一个集所有现代建模技术于一身的...
一、存储过程 存储过程就像数据库中运行的方法(函数) 优点:...
一、Ueditor的下载 1、百度编辑器下载地址:http://ueditor....