使用阿里云实时翻译

有没有人尝试过使用阿里云 SDK 创建实时视频通话应用程序？当我询问支持时，他们说国际阿里云不提供视频通话服务，但中国云可以。他们还提到我可以尝试使用他们的 SDK 进行制作。我现在正在向他们询问提到的 SDK，这些 SDK 是什么。

如果有在相关领域或技术方面有经验的人，请帮助我弄清楚是否值得使用阿里云或使用其他云服务，因为阿里云不支持多云。

非常感谢谢谢！！！

好消息：有许多潜在的供应商和选项可以将某些东西拼凑在一起。

坏消息：这个问题并不容易，顶级研究和产品团队的产品都不是很健壮。

您可以在 modelfront.com/compare 找到所有自助机器翻译 API 提供商的列表。大多数相同的提供商还提供语音识别 API，并且语音识别也可在许多设备上使用。

但是，根据您的情况，您最好使用语音到语音的方法（相对于将多个系统粘合在一起），甚至是本地模型（相对于外部 API），原因有以下三个：质量和延迟，以及两者的相互作用——即用户不想等待完整的句子，也不想翻译文本闪烁随着新词的出现。

如果您在 r/machinetranslation 中搜索 speech OR simultaneous OR interpreting，您会发现：

Baidu Research 在 WMT 2019 上就此发表了主题演讲，最近还有来自 Google 的 more on flickering 主题演讲，但两者都专注于自己的产品，而不是面向外部开发者的产品。