问题描述
我想制作一个将 RMS amplitude 分箱为音频文件的直方图。目标是在文件的整个持续时间内显示每个幅度级别的信号量。是否有带有此功能的 Python 包?如果不是,如何编码?
我还想设置计算分析的频率范围,例如1 到 6 kHz 之间。
我有以下粗略的开始,虽然我还不明白它代表什么,而且它肯定不使用 RMS:
import numpy as np
import matplotlib.pyplot as plt
Fs,data = wavfile.read('file')
print('data =',data)
print('number of samples in data =',len(data))
subset = data[0:44100]
subset = abs(subset)
print('number of samples in subset =',len(subset))
plt.hist(subset,bins='auto')
plt.show()
解决方法
据我所知,numpy
中的 RMS 没有特殊功能,但你可以这样做
RMS = np.sqrt(np.mean(x**2))
问题是,您要针对哪些数据(针对哪些 x
)计算 RMS。
例如,您可以对每个样本应用 RMS,而不是假设您的 wav 文件中只有一个通道:
length = data.shape[0] / Fs
print(f"length = {length}s")
RMS = lambda x: np.sqrt(np.mean(x**2))
sample = np.arange(int(length))
RMS_of_sample = np.zeros(sample.shape)
for ns in sample:
# here you can apply the frequency window for the sample
RMS_of_sample[ns] = RMS(data[ns*Fs:(ns+1)*Fs])
plt.hist(RMS_of_sample,label="Left channel")
plt.show()
在这里你也可以应用一些signal windows。 这段代码给了你这样的东西
对于输入信号:
关于完整/部分频率范围的评论中问题的补充
如果你想在某个频域分析一个完整的信号,你可以像这样对频率范围[filter_freq_min,filter_freq_max]
应用简单的滤波器(矩形频率窗口):
from scipy.fft import fft,ifft,fftfreq
filter_freq_min = 1000 # Hz
filter_freq_max = 2000 # Hz
freq = fftfreq(len(data),1 / Fs)
data_fft = fft(data)
condition = np.logical_or(abs(freq) <= filter_freq_min,abs(freq) >= filter_freq_max)
filtered_data_fft = np.copy(data_fft)
filtered_data_fft [condition] = 0
filtered_data = np.real(ifft(filtered_data_fft ))
# show fft for incoming signal (blue) and filtered signal (orange)
plt.plot(freq,np.abs(data_fft),'.')
plt.plot(freq,np.abs(filtered_data_fft ),'.')
plt.xlim( [10,Fs/2] )
plt.xlabel( 'Frequency (Hz)' )
plt.show()
# check RMS for filtered and unfiltered signal
print(RMS(filtered_data),RMS(data))
通过这种方式,您可以在所需的频率范围内循环。
要直接在 Python 中播放声音,可以使用
import sounddevice as sd # For playing/recording audio
sd.play(data,Fs)
sd.play(filtered_data,Fs)