问题描述
我有一个包含5个独立字段的表格,大约有5个。 500,000行。所有字段均为数字和浮点数,即非整数。根据每个字段的样本输入数据,我需要返回所有字段的完全匹配或最匹配的行号。
Sample data:
fldA,fldB,fldC,fldD,fldE
2.45,11.27,182.88,45.2,2.59
Table:
fldA,fldE
3.0672,19.31,49.7,113.2,5.0115
3.598,14.4591,242.7,193.2,3.502
1.259,7.14,135.2,93.97,4.097
2.35,11.91,187.63,37.6,1.5249
2.7635,9.49,201.03,79.1,13.8654
Desired output:
return row 4 (2.35,1.5249)
如果我只需要精确匹配,我可以很容易地使用嵌套的'if and'语句,但是我很难在没有精确匹配的情况下需要最佳匹配的事实,并且值可以出现在同一字段中不止一次,所以我认为每个字段的所有回报都需要存储,然后进行比较。但这不会考虑匹配附近的行,例如相差0.01。
起初我以为我可以计算出样本数据与表格之间的百分比差异,但这似乎令人费解,因此认为可能有一种更简单的方法。