Android 上的实时电话通话字幕/转录语音到文本

问题描述

这个问题是为了帮助“重听社区”,让他们可以阅读电话/移动电话,因为他们听不到。

Android 11 提供了一个 API“AudioPlaybackCaptureConfiguration”。此 API 使应用能够复制其他应用正在播放的音频。

Google 还在 Pixel 手机上实现了相同的功能,如下所示 - https://www.youtube.com/watch?v=7hb3p8LZIq8 。但它几乎没有限制 -

  1. 它只支持英语,如何启用对区域语言的支持
  2. 当前的实现使用本地移动引擎将语音转换为文本,即语音不会发送到谷歌服务器(所有处理都在移动设备本身离线进行),因此准确性也很低。

在这里看到很多帖子后,似乎开发人员在实现相同的功能以捕获来电者的声音然后由于 Google 的某些限制对其进行转录时遇到了问题。

How to record internal audio on Android devices or record MediaPlayer Audio Stream?

无论如何要捕捉来电者的声音 (https://developer.android.com/guide/topics/media/playback-capture#allowing_playback_capture) 吗?就像我上面分享的 youtube 视频一样,谷歌必须捕捉来电者的声音,其离线引擎正在处理该声音并将其转换为文本。那么我们是否可以使用某种方式捕获来电者的声音,然后将该声音发送到某个服务器 API 或 Google Live Transcribe 应用程序(或其他任何应用程序)以获得更高的准确性,然后转换后的文本将显示在屏幕上(根据用户选择语言)。

我也是一名开发人员,但不是移动开发人员。所以有些术语可能是错误的,请原谅并提供您的建议。

我们是否可以根据我们的要求修改 Android 源代码本身并消除该限制,以便即使需要构建自定义 Android 操作系统,我们也可以实现我们想要做的事情?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)