从nodejs中的Opus缓冲区创建Ogg数据包

问题描述

几天来,我在这个问题上一直陷于困境,祈祷有人能够向我指出正确的方向。

我有一个https://github.com/discordjs/opus编码的Opus缓冲区流

我想将它们发送到Google语音中的text api,要求将它们封装在ogg容器中:https://cloud.google.com/speech-to-text/docs/reference/rpc/google.cloud.speech.v1#audioencoding

我正在尝试使用此库: https://github.com/TooTallNate/node-ogg

这是我正在尝试的:

const oggEncoder = ogg.Encoder();
const oggStream = oggEncoder.stream();

const audioInputStreamTransform = new Writable({
  write(frame,encoding,next) {
    if (frame) {
        oggStream.write(frame);
      }
    }
    next();
  },});

voiceStream.pipe(audioInputStreamTransform)
oggEncoder.pipe(google-speech2textStream)

// Neither of these work - nothing appears to be happening
// No data events emitted from either stream
// oggEncoderStream.pipe(google-speech2textStream)

在发送到oggStream.write之前,我还尝试使用ogg-packet库将缓冲区包装在ogg_packet结构中。这也导致没有数据事件被发出。鉴于ogg-packet所说,我很确定这是错误方法

您很可能不需要出于任何实际目的使用此模块

但是我想我还是会尝试。

我尝试过的

          const packet = new ogg_packet();
          packet.packet = frame;
          packet.bytes = frame.length;

          // this will be the first packet in the ogg stream
          packet.b_o_s = 1;
          // there will be more `ogg_packet`s after this one in the ogg stream
          packet.e_o_s = 0;

          // the "packetno" should increment by one for each packet in the ogg stream
          packet.packetno = packetno++;

          // No joy with any of these
          //oggStream.write(ogg.ogg_packet(packet));
          //oggStream.write(packet);
          //oggStream.write(packet.buffer);

在音频编码方面,我是一个真正的新手,所以我可能会误解该过程的某些部分-抱歉,这很琐碎,但我已经进行了大约一周了?

如果有更好的地方寻求帮助,请随时帮助我-谢谢:)

还尝试了没有运气的情况下从node-opus尝试类似this example


好的,所以进一步挖掘:

我下载了node-opus,该文件已与node-ogg一起使用

我注意到Encoder.encode的结果在node-opus和@ discordjs / opus之间是不同的。似乎node-opus吐出了我认为是ogg_packet的内容,而discordjs / opus提供了一个缓冲区。

即: opus流-> discord / opus.decode-> node-opus.encode->日志:

{ packet: <Buffer 4f>,bytes: 19,b_o_s: 1,e_o_s: 0,granulepos: -1,packetno: 0,'ref.buffer':
   <Buffer 18 33 11 04 01 00 00 00 13 00 00 00 00 00 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ff ff ff ff ff ff ff ff 00 00 00 00 00 00 00 00> }

相比 opus流-> discord / opus.decode-> discord / opus.encode->日志:

<Buffer 78 80 64 26 7e d0 2f e8 f5 a5 6d 1c da 41 04 0b 33 d9 ee 3a 0b ee 53 a6 f6 bb cf 55 c8 e3 36 e1 18 4a 9f e9 7f 94 8d a3 0c 96 b3 a1 f7 03 e7 9a 78 db ... >

所以这将是我的问题。我想我需要从这些缓冲区创建ogg数据包...

我很好奇为什么这两个opus编码库如此之大,除非我把王室的东西弄乱了

解决方法

如上所述,答案是ogg软件包期望使用ogg_packets,而@ discordjs / opus却不提供这种要求。