问题描述
Microsoft的批处理管道中似乎有(有限)对说话人差异化的支持,但我在SDK中找不到对它的引用(我们使用的是Microsoft.CognitiveServices.Speech 1.13.0)。是否有某种我不知道的使用C#SDK请求说话者区分的方法?或者,有人知道将来是否计划提供这种支持吗?
解决方法
感谢您与我们联系。当前,Azure Speech Service批处理语音转文本不支持SDK(目前尚无有关何时可用支持的公共信息)。但是,Azure语音服务SDK的ConversationTranscriber API可以实现实时语音识别,发言人识别和双向化(非常适合录制现场会议并具有区分发言人的能力)。 C#也支持ConversationTranscriber API。