如何提高 Google Speech to Text API 中标点符号和类标记的准确性

父亲的[文件]名为 Annonymos a n n o y m o u s 备忘录日期 222019[2222019 ] 电话会议

支持的类令牌

This page 可以在 gb 中使用 Speech-to-Text for English 显示支持的语音自适应类标记。

类令牌	说明	口语例子	书面例子
$OOV_CLASS_ALPHANUMERIC_SEQUENCE	一系列字母 [a-z] 和/或数字。	"a b c" "一二三" "abconetwothree"	ABC 123 ABC123
$OOV_CLASS_ALPHA_SEQUENCE	字母序列 [a-z]。	"a b c" "c q b c f" "h q q g w r m y o"	ABC CQBCF HQQGWRMYO

我们查看了索赔信，被告的撇号在此之前做出了回应

通过这次。 停止段落问题是我们如何进行问号我说我们可以逗号
理论上逗号从精神科医生那里获得报告，但他必须进行评估。泌尿系统症状支架
它们是紧密的括号，如果有括号

，请考虑括号的影响

我在提高听写的转录准确性方面遇到了两个麻烦。请看我上面附上的图片。

我使用了带有 Class Token 和 boost 的 Google Speech Adaptation Feature。但仍与图 1 一样，拼写名称时，结果并未显示为单词，而是显示为单个字母。在听写中，有很多拼写名字的习惯，即使我使用了类标记“$OOV_CLASS_ALPHA_SEQUENCE”，它也没有显示为一个单词。
另一个问题是标点符号问题。在听写中，人们会说，停止，逗号，问号，括号之类的来形成格式。但是我在代码中启用了自动标点为true，但标点符号仍然不正确并且显示为一个单词，如 Image3。

有什么办法可以改善这些问题。或者我错过了什么。如果是这样，你能不能告诉我一些方法。非常感谢您提前抽出时间。

谢谢。

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）