问题描述
在我的 MERN 堆栈项目中,我有两个 MediaStream,我将它们合二为一(使用 audioContext.createMediaStreamDestination())。 然后我将此流发送到 AWS transcribe。我需要能够区分来自这两个不同流(一个流 = 一个扬声器)的扬声器。亚马逊内置的说话者识别功能目前仅适用于英语,而我正在使用德语。 AWS 还提供了区分渠道的可能性。是否有可能将我的两个流转换为一个流的两个通道而不是简单的混合,然后我可以将其发送到 AWS 并使用通道识别来区分扬声器?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)