获取TTS的单词时间戳

问题描述

我有一个日语文本,我正在使用Google Cloud Text to Speech功能将其转换为mp3。

我还想提供Google传回的mp3的字时间戳。

Google Speech to Text提供了此功能,但是当我提交从TTS到STT的文件时,结果并不总是很好。

同时获取TTS mp3字词时间戳的最佳方法是什么?

解决方法

Google Cloud Speech-to-Text是一项基于ML的服务,因此,预期结果并不总是像您期望的那样“好”,这是有局限性的。

我可以建议看一下他们关于该主题的相关文档,例如best practicesguide和讨论它们的基础知识page。此外,您可以查看其问题跟踪平台中的问题,例如此issue,以获取有关其的更多信息,即使您在服务中发现可复制的问题,也可以在其中发布,因此其团队可以可以意识到这一点。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...