浮动列表之间的相似性

问题描述

我有一个浮点数列表,我想与其他列表进行比较并在 python 中获取相似度:

我要比较的列表:

[0.0000,0.0003,-0.0001,0.0002,0.0001,0.0000,-0.0002,-0.0001]

其他列表之一:

[0.0000,0.0005,-0.0010,0.0000]

我尝试将它们转换为字符串并使用fuzzywyzzy 库、python-Levenshtein 和difflib 来比较字符串并获得一个比率,但这并没有给我想要的结果,而且速度很慢。我搜索过,但没有找到任何相关信息。

比较 2 个浮点数列表的最佳方法是什么?

我想知道是否有一种本地方式来比较浮点列表的相似性,或者是否有一个库可以完成这项工作,例如字符串比较的许多示例。

解决方法

这个问题在我看来并不完全清楚,不过您可以看看以下方法是否对您有帮助:

import numpy as np
l1 = np.array([0.0000,0.0003,-0.0001,0.0002,0.0001,0.0000,-0.0002,-0.0001])
l2 = np.array([0.0000,0.0005,-0.0010,0.0000])

mse1 = ((l1 - l2)**2).mean()
# Out[180]: 6.699999999999999e-08

l1 = np.array([0.0000,-0.0001])
l2 = np.array([1.0000,1.0002,1.0000,0.0000])

mse2 = ((l1 - l2)**2).mean()
# Out[180]: 0.15000006700000001

mse1 < mse2
# Out[187]: True

您不会得到介于 0 和 1 之间的值,但您可以比较结果,它们越相同,越接近 0。mse 代表均方误差。但是还有更多可能与您相关的指标,例如 msle、mae 等。