`fft` 乘以 `scipy.signal` 窗口时显着放缓

问题描述

import numpy as np
import scipy.signal as sig
from scipy.fft import fft
from timeit import default_timer as dtime

dtype = 'float32'
n_fft = 598
A = np.random.randn(n_fft,160000).astype(dtype)
v0 = sig.windows.dpss(n_fft,4).astype(dtype)
v1 = sig.windows.dpss(n_fft,n_fft // 8).astype(dtype)
v = v1

#%%###############################################################
t0 = dtime()
fft(A)
print(dtime() - t0)

A *= v.reshape(-1,1)
#%%###############################################################
t0 = dtime()
fft(A)
print(dtime() - t0)

>>> 1.3161122000001342
>>> 4.751361799999813

如果使用 v = v0 或 dtype = 'float64' 则相等。为什么会发生这种情况？ (more times)

注意：解决方法是v = v1 + 1、v -= 1，但这应该不是必需的...提交Issue。

Win 10 x64、numpy 1.18.5、scipy 1.6.1、Python 3.7.9。

解决方法

这是由非规范化（非常小的非零数字）引起的，它使某些 CPU 指令运行得更慢； details。解决方法是手动将它们归零，如在 +1/-1 中，或通过例如“安全地” ftz（和 after 类型转换）：

from ftz import ftz

ftz(v)
A *= v.reshape(-1,1)

t0 = dtime()
fft(A)
print(dtime() - t0)

>>> 1.4638332999998056
>>> 1.4597183999999288

fft fft numpy python scipy scipy