语音识别和 Sphinx 入门

问题描述

Sphinx 似乎是 Java 语音识别的唯一选择。文档很少,需要高水平的领域知识。我使用了他们的启动程序示例,它适用于一个文件,而不适用于另一个极其相似的文件。 有什么区别?让它更准确地工作的秘诀是什么。

文件 https://www.opdsupport.com/downloads/miscellaneous/sample-audio-files/52-welcome-wav/download 有效,但此文件 https://www.opdsupport.com/downloads/miscellaneous/sample-audio-files/49-longwelcome-wav/download 无效。
我注意到非工作文件的采样率不同,所以我用程序将其转换为 16000,但仍然没有运气

解决方法

请务必仔细检查文件。根据 the docs,您的文件必须为 8khz 或 16khz 且仅限单声道。有很多工具可以做到这一点——我使用 audacity,但对于像这样的基本转换来说可能有点过分。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...