谷歌语音识别弱日期转录

问题描述

我目前正在使用带有德语语音模型 (de-DE) 的 google asr/tts,并且在日期提取的某些使用场景中遇到错误的结果。

我真的很想知道其他人是否也有类似的结果。

让我给你举几个例子:

我是说:

"der 1.10.1905" -> "1. 10195 11095"

“9.5.78”-> 90587

“22.11.98” -> 22.11 89

但是:

“98 年 11 月 22 日”->“98 年 11 月 22 日”

当我完全限定月份词时,它一切正常。

我还通过使用提示检查了建议的优化方法,但没有任何改进

"speechContexts": [
            {
              "phrases": [
                "$FULLDATE"
              ]
            }
          ]

这是人们必须接受的东西还是我可以尝试的任何东西?

干杯安德烈

解决方法

在使用您的示例时,我的结果与您的结果相同。但如果说话者说 ein tausend neun hundert acht und neunzig,它确实可以正确转录。

似乎出于某种原因,在德语中,API 无法识别说话者何时使用数百来表示数千(即 nineteen hundred ninety eight 而不是 one thousand nine hundred ninety eight)。

我不会德语,无法确认这种表示数字/日期的方式是否是官方的,但如果您确定德语是官方接受的,那么我建议您在 {{3 }} 有一些参考资料来确认。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...