问题描述
对于频谱图(其中x轴是时间,y轴是频率)的这种变换的感觉是以某种方式根据不同的alpha值沿y轴拉伸它,而顶部(最大频率)底部(零频率)保持不变。 但是现在我真的不知道如何实现它。
首先,我应该在哪个步骤上进行频率弯曲?我正在使用Librosa提取特征并将音频转换为log-mel频谱图。应该在转换为质谱图之前还是在STFT之前/之后执行此操作?
第二,我可以按照哪种方式映射每个频率?作者提到他们使用了OpenCV的“几何图像变换”,但我只发现了仿射变换和透视变换似乎相关,但是我无法通过使用它们来实现这种映射。
欢迎任何建议和评论,非常感谢!
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)