问题描述
我正在编写一个程序来使用 CMU Sphinx 转录音频。我对质量不满意,我想也许我可以找到更好的模型。但我真的不明白可用模型之间的区别。 sphinx4-data jar 中有模型,然后我找到了这个页面,https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English/,但我不完全理解它们之间的区别。而且我什至不确定要使用哪些文件。
有声学模型、词典和语言模型。
我希望我的程序尽可能通用,即能够转录任何演讲(首先是英语)。什么是最好的模型?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)