`fft` 乘以 `scipy.signal` 窗口时显着放缓

问题描述

import numpy as np
import scipy.signal as sig
from scipy.fft import fft
from timeit import default_timer as dtime

dtype = 'float32'
n_fft = 598
A = np.random.randn(n_fft,160000).astype(dtype)
v0 = sig.windows.dpss(n_fft,4).astype(dtype)
v1 = sig.windows.dpss(n_fft,n_fft // 8).astype(dtype)
v = v1

#%%###############################################################
t0 = dtime()
fft(A)
print(dtime() - t0)

A *= v.reshape(-1,1)
#%%###############################################################
t0 = dtime()
fft(A)
print(dtime() - t0)
>>> 1.3161122000001342
>>> 4.751361799999813

如果使用 v = v0dtype = 'float64' 则相等。为什么会发生这种情况? (more times)

注意解决方法v = v1 + 1v -= 1,但这应该不是必需的...提交Issue

Win 10 x64、numpy 1.18.5、scipy 1.6.1、Python 3.7.9。

解决方法

这是由非规范化(非常小的非零数字)引起的,它使某些 CPU 指令运行得更慢; details。解决方法是手动将它们归零,如在 +1/-1 中,或通过例如“安全地” ftz(和 after 类型转换):

from ftz import ftz

ftz(v)
A *= v.reshape(-1,1)

t0 = dtime()
fft(A)
print(dtime() - t0)
>>> 1.4638332999998056
>>> 1.4597183999999288