如何将以下频谱环绕增强应用于python中的音频?

问题描述

enter image description here

对于频谱图(其中x轴是时间,y轴是频率)的这种变换的感觉是以某种方式根据不同的alpha值沿y轴拉伸它,而顶部(最大频率)底部(零频率)保持不变。 但是现在我真的不知道如何实现它。

首先,我应该在哪个步骤上进行频率弯曲?我正在使用Librosa提取特征并将音频转换为log-mel频谱图。应该在转换为质谱图之前还是在STFT之前/之后执行此操作?

第二,我可以按照哪种方式映射每个频率?作者提到他们使用了OpenCV的“几何图像变换”,但我只发现了仿射变换和透视变换似乎相关,但是我无法通过使用它们来实现这种映射。

欢迎任何建议和评论,非常感谢!

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...