Mozilla Deep Speech SST突然无法拼写

问题描述

我正在用深沉的言语表达文字。直到0.8.1,当我运行类似以下内容的转录时:

byte_encoding = subprocess.check_output(
"deepspeech --model deepspeech-0.8.1-models.pbmm --scorer deepspeech-0.8.1-models.scorer --audio audio/2830-3980-0043.wav",shell=True)
transcription = byte_encoding.decode("utf-8").rstrip("\n")

我会得到相当不错的结果。但是从0.8.2开始,删除了得分手参数,我的结果到处都是拼写错误,这让我觉得我现在正在获得一个字符级模型,而以前我只是一个单词级模型。错误的方向似乎是未正确指定模型。

现在我打电话时

byte_encoding = subprocess.check_output(
    ['deepspeech','--model','deepspeech-0.8.2-models.pbmm','--audio',myfile])
transcription = byte_encoding.decode("utf-8").rstrip("\n")

我现在看到类似的错误

  • 无尽->“无尽”
  • 服务->“服务”
  • 旧版->“ legaci”
  • 收入->“正在发呆”
  • 之前->“ befir”

我并不是100%都与从API中删除计分器有关,但这是我看到and the documentation suggested accuracy improvements in particular发行版之间发生变化的一件事。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)