如何在不使用外部 API 的情况下转录音频?

问题描述

我不想使用亚马逊、谷歌等,那么我将如何使用我自己的电脑 (macOS) 来获得带时间戳的 mp3 和视频转录?最好在命令行上。所以我可以做这样的事情

transcribe -o oliver_twist.srt oliver_twist.mp3

...从 mp3 创建 SRT 字幕文件

解决方法

Kdenlive 能够从音频文件生成 SRT 文件:参见 Kdenlive。它也适用于 MacO。

安装 Kdenlive 后,您可以安装 Kdenlive 命令行 工具以从命令行操作 Kdenlive:参见 Kdenlive command line

,

对于 Linux,有一个名为 voice2json 的包:http://voice2json.org/commands.html#transcribe-wav

只要你有一个音频文件:sample.wav你运行

voice2json transcribe-wav < simple.wav

然后你得到输出

{"text": "sample voice recording","transcribe_seconds": 0.123,"wav_seconds": 1.23}

我相信你可以把这个 Linux 包安装到 macOS 上。要做到这一点,只需查看:https://apple.stackexchange.com/questions/53096/is-it-possible-to-install-linux-packages-on-os-x

编辑:

要获得 srt,您需要一个名为 jq 的包。你可以用同样的方法安装它。假设您上一个命令的输出是 output.json。您需要做的是:

jq .text output.json > subtitles.srt 并且输出将保存为 subtitles.srt