语音识别和 Sphinx 入门

编程问答 2022-05-29

问题描述

Sphinx 似乎是 Java 语音识别的唯一选择。文档很少，需要高水平的领域知识。我使用了他们的启动程序示例，它适用于一个文件，而不适用于另一个极其相似的文件。有什么区别？让它更准确地工作的秘诀是什么。

此文件 https://www.opdsupport.com/downloads/miscellaneous/sample-audio-files/52-welcome-wav/download 有效，但此文件 https://www.opdsupport.com/downloads/miscellaneous/sample-audio-files/49-longwelcome-wav/download 无效。
我注意到非工作文件的采样率不同，所以我用程序将其转换为 16000，但仍然没有运气

解决方法

请务必仔细检查文件。根据 the docs，您的文件必须为 8khz 或 16khz 且仅限单声道。有很多工具可以做到这一点——我使用 audacity，但对于像这样的基本转换来说可能有点过分。

cmusphinx java java speech-recognition sphinx4

相关问答

Selenium Web驱动程序和Java元素在(x，y)点处不可单击其他元素将获得点击?

Selenium Web驱动程序和Java。元素在(x，y)点处不可单击。其...

Python-如何使用点“” 访问字典成员？

Python-如何使用点“。” 访问字典成员？

Java 字符串是不可变的到底是什么意思？

Java 字符串是不可变的。到底是什么意思？

Java中的“ final”关键字如何工作？我仍然可以修改对象

Java中的“ final”关键字如何工作？（我仍然可以修改对象。...

“loop:”在Java代码中这是什么，为什么要编译？

“loop:”在Java代码中。这是什么，为什么要编译？

java.lang.ClassNotFoundException：sun.jdbc.odbc.JdbcOdbcDriver发生异常为什么？

java.lang.ClassNotFoundException：sun.jdbc.odbc.JdbcOdbc...