如何提高 Google Speech to Text API 中标点符号和类标记的准确性

问题描述

图片 1 My result of transcription after using Class Token "$OOV_CLASS_ALPHA_SEQUENCE"

父亲的[文件]名为 Annonymos a n n o y m o u s 备忘录日期 222019[2222019 ] 电话会议

图片 2 Supported Google Class Token

支持的类令牌

This page 可以在 gb 中使用 Speech-to-Text for English 显示支持的语音自适应类标记。

类令牌 说明 口语例子 书面例子
$OOV_CLASS_ALPHANUMERIC_SEQUENCE 一系列字母 [a-z] 和/或数字。 "a b c"
"一二三"
"abconetwothree"
ABC
123
ABC123
$OOV_CLASS_ALPHA_SEQUENCE 字母序列 [a-z]。 "a b c"
"c q b c f"
"h q q g w r m y o"
ABC
CQBCF
HQQGWRMYO

图片 3 Punctuation Not recognized

我们查看了索赔信,被告的撇号在此之前做出了回应

通过这次。 停止段落问题是我们如何进行问号我说我们可以逗号
理论上逗号从精神科医生那里获得报告,但他必须进行评估。泌尿系统症状支架
它们是紧密的括号,如果有括号

,请考虑括号的影响

我在提高听写的转录准确性方面遇到了两个麻烦。 请看我上面附上的图片。

  1. 我使用了带有 Class Token 和 boost 的 Google Speech Adaptation Feature。但仍与图 1 一样,拼写名称时,结果并未显示为单词,而是显示为单个字母。在听写中,有很多拼写名字的习惯,即使我使用了类标记“$OOV_CLASS_ALPHA_SEQUENCE”,它也没有显示为一个单词。

  2. 另一个问题是标点符号问题。在听写中,人们会说,停止,逗号,问号,括号之类的来形成格式。但是我在代码中启用了自动标点true,但标点符号仍然不正确并且显示为一个单词,如 Image3。

有什么办法可以改善这些问题。或者我错过了什么。如果是这样,你能不能告诉我一些方法。非常感谢您提前抽出时间。

谢谢。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)