将SDL F32字节转换为样本[-1.0-1.0]会产生静态噪声

问题描述

我正在尝试将来自SDL2音频设备的麦克风输入转换为浮点样本。目前,我正在获取静态-非一致性静态-而是静态的响应麦克风输入。

因此,当不与麦克风通话时,不会听到可听到的静电。使用麦克风时,静态跟随短语,动态变化。我觉得我真的很接近要开始工作,但我做错了(可能很明显)。

我正在SDL中设置音频设备,如下所示:

SDL_AudioSpec as;
as.freq = aSamplerate;
as.format = AUdio_F32;
as.channels = 1;
as.samples = aBuffer;
as.callback = _sdl_cb;
as.userdata = (void*)aSoloud;
gAudiodeviceid = SDL_OpenAudioDevice(NULL,1,&as,&gActiveAudioSpec,SDL_AUdio_ALLOW_ANY_CHANGE & ~(SDL_AUdio_ALLOW_FORMAT_CHANGE | SDL_AUdio_ALLOW_CHANNELS_CHANGE));
if (gAudiodeviceid == 0)
{
    as.format = AUdio_S16;
    gAudiodeviceid = SDL_OpenAudioDevice(NULL,SDL_AUdio_ALLOW_ANY_CHANGE & ~(SDL_AUdio_ALLOW_FORMAT_CHANGE | SDL_AUdio_ALLOW_CHANNELS_CHANGE));
    if (gAudiodeviceid == 0)
    {
        return UNKNowN_ERROR;
    }
}

//Calculate per sample bytes
int bytesPerSample = gActiveAudioSpec.channels * ( SDL_AUdio_BITSIZE( gActiveAudioSpec.format ) / 8 );

gBufferByteSize = bytesPerSample * aBuffer;

audioHoldingPattern = new Uint8[ gBufferByteSize ];

memset( audioHoldingPattern,gBufferByteSize );
SDL_PauseAudioDevice(gAudiodeviceid,0);
  • gActiveAudioSpec是SDL返回的“正确”规范。
  • audioHoldingPattern实际上是回调上我的音频缓冲区的保留模式(如下所示)。我需要这样的东西,因为我将其与请求缓冲区而不是接受缓冲区的库(SoLoud)结合使用。最新的缓冲区将保留在此处,直到将其发送回SoLoud。

这是我在SDL回调中所做的:

static void _sdl_cb(void * userdata,Uint8 * pcm,int len){
    if (SDL_GetAudioDeviceStatus(gAudiodeviceid) == SDL_AUdio_PLAYING) {
        memcpy( &audioHoldingPattern[0],pcm,len );
    }
}

这是SoLoud从以下位置请求新缓冲区的地方:

unsigned int MicrophoneInstance::getAudio(float* aBuffer,unsigned int aSamplesToRead,unsigned int aBufferSize)
{       
        int size = aBufferSize;
        float *signal = reinterpret_cast<float*>(audioHoldingPattern);

        memcpy(aBuffer,signal,aBufferSize);

        return (unsigned int)sizeof(signal);
}
  • aBuffer是SoLoud提供的要复制到的缓冲区

请帮助!

解决方法

您的帖子中没有足够的信息来帮助您。设置SDL音频上下文时,您已经指定了预期的音频格式(可能是16位,小字节序,有符号)。可能是S16LE或U16LE或...

一旦在代码中找到了这个,就需要先将接收到的缓冲区转换为要求的格式,然后以浮点数计算值。

例如,如果音频缓冲区格式为S16LE(带符号的16位小端序),并且您使用的是小端序机(很有可能),那么您将执行以下操作:

   Int16 sample; // Range of data is +32767 -32768 or ~ +/- 1<<15 - 1
   float scale = (float)(1.0 / (double)(1 << (sizeof(sample) - 1)));
   for (int i = 0; i < len; i += sizeof(sample)) 
   {
      memcpy(&sample,&pcm[i],sizeof(sample)); // Use this so it'll work on machine that don't allow non-aligned access to char buffers
      float s = sample * scale;
      [...] // Do whatever you want with s
   }

编辑:您的代码有问题。 首先,您请求32位浮点采样(行as.format = AUDIO_F32;,并首次调用SDL_OpenAudioDevice)。 然后,如果失败,则按照我上面的示例中的要求输入S16(带符号的16位)。 问题是您不跟踪将得到的格式(它是浮动格式吗?是S16吗?)。

因此,要么删除第一个使用F32格式的电话,而仅保留S16格式(并使用上面的代码对其进行转换)。 或者,将接受的格式存储在某处,并根据接受的格式采取不同的行动。

在F32的情况下,您可以通过像这样pcm

转换float*变量为float * buffer = (float*)pcm;