是什么触发了Google Cloud Speech流API的中间结果?

问题描述

这似乎是沉的特定秒数,但是我还没有找到确切的答案。

解决方法

此详细信息未在文档中公开提供。由于interim_results用于流请求以在流期间获取部分翻译,因此我猜测这不是简单明了的规则,但很可能与所使用的ML模型有关,因此很难识别每种情况的确切触发因素。

尽管如此,我想知道为什么您需要知道流媒体请求期间音频发生的情况和临时结果之间的关系。例如,如果您想在说话者每次暂停时拆分请求和翻译,则可以对每个请求使用single_utterance=true