音频文件RMS幅度的Python直方图

问题描述

我想制作一个RMS amplitude 分箱为音频文件的直方图。目标是在文件的整个持续时间内显示每个幅度级别的信号量。是否有带有此功能的 Python 包?如果不是,如何编码?

我还想设置计算分析的频率范围,例如1 到 6 kHz 之间。

我有以下粗略的开始,虽然我还不明白它代表什么,而且它肯定不使用 RMS:

import numpy as np
import matplotlib.pyplot as plt
   
Fs,data = wavfile.read('file') 
print('data =',data)
print('number of samples in data =',len(data))

subset = data[0:44100] 
subset = abs(subset)
print('number of samples in subset =',len(subset))

plt.hist(subset,bins='auto')  
plt.show()

解决方法

据我所知,numpy 中的 RMS 没有特殊功能,但你可以这样做

RMS = np.sqrt(np.mean(x**2))

问题是,您要针对哪些数据(针对哪些 x)计算 RMS。 例如,您可以对每个样本应用 RMS,而不是假设您的 wav 文件中只有一个通道:

length = data.shape[0] / Fs
print(f"length = {length}s")

RMS = lambda x: np.sqrt(np.mean(x**2))

sample = np.arange(int(length))
RMS_of_sample = np.zeros(sample.shape)
for ns in sample:
    # here you can apply the frequency window for the sample 
    RMS_of_sample[ns] = RMS(data[ns*Fs:(ns+1)*Fs])

plt.hist(RMS_of_sample,label="Left channel")
plt.show()

在这里你也可以应用一些signal windows。 这段代码给了你这样的东西

enter image description here

对于输入信号:

enter image description here


关于完整/部分频率范围的评论中问题的补充

如果你想在某个频域分析一个完整的信号,你可以像这样对频率范围[filter_freq_min,filter_freq_max]应用简单的滤波器(矩形频率窗口):

from scipy.fft import fft,ifft,fftfreq

filter_freq_min = 1000 # Hz
filter_freq_max = 2000 # Hz

freq = fftfreq(len(data),1 / Fs)
data_fft = fft(data)

condition = np.logical_or(abs(freq) <= filter_freq_min,abs(freq) >= filter_freq_max)
filtered_data_fft = np.copy(data_fft)
filtered_data_fft [condition] = 0
filtered_data = np.real(ifft(filtered_data_fft ))

# show fft for incoming signal (blue) and filtered signal (orange) 
plt.plot(freq,np.abs(data_fft),'.')
plt.plot(freq,np.abs(filtered_data_fft ),'.')
plt.xlim( [10,Fs/2] )
plt.xlabel( 'Frequency (Hz)' )
plt.show()

# check RMS for filtered and unfiltered signal
print(RMS(filtered_data),RMS(data))

enter image description here

通过这种方式,您可以在所需的频率范围内循环。

要直接在 Python 中播放声音,可以使用

import sounddevice as sd # For playing/recording audio
sd.play(data,Fs)
sd.play(filtered_data,Fs)