有效地找到两个向量中最接近的对?

问题描述

给定两个类型为double的排序后的向量,其中向量的大小可能不同,我想生成一个对列表,这是两个向量中每个向量的一个元素,其中一对元素之间的差为最小化,并且没有两个对共享一个元素。向量都很大,必须在很短的时间内完成任务。

我尝试使用二进制搜索(请参见下文),以比较相邻元素来确定“最接近”匹配,但是效率不足以在所需时间范围内完成任务。

插值搜索所需的时间也很长。在某些算法中使用std::lower_bound()可以极大地加快代码的速度,但是它并不认为元素小于搜索值。

有没有很好的方法可以做到这一点?

double binarySearch(vector<double> vec,double val) {
       int left = 0; 
       int right = vec.size();
    
       while (left <= right) {
              int mid = (left+right)/2;

              if (vec[mid] == val)
                  return mid;
              else if (vec[mid] < val)
                       left = mid + 1;
              else 
                       right = mid - 1;
       }

       return minimum(vec[mid],vec[mid+1],vec[mid-1]);
}

解决方法

希望这是您的意思:

#include <algorithm>
#include <cstddef>
#include <iostream>
#include <limits>
#include <utility>
#include <vector>

template<class T>
std::vector<std::pair<T,T>> getClosestPairs(std::vector<T> v1,std::vector<T> v2) {
    std::vector<std::pair<T,T>> vPair;
    std::pair<size_t,size_t> indexs;
    std::pair<T,T> close;

    size_t i = 0,j = 0;
    T minDiff = std::numeric_limits<T>::max();

    while(v1.size() != 0 && v2.size() != 0) {
        while(i < v1.size() && j < v2.size()) {
            T diff = v1[i] < v2[j] ? v2[j] - v1[i] : v1[i] - v2[j];
            if(diff < minDiff) {
                minDiff = diff;
                // save index to delete them
                indexs = {i,j};
                // save the closest pair
                close = {v1[i],v2[j]};
            } else { // reached to min no need to move on res the cells
                break;
            }

            // Move the smaller vector's index forward
            if(v1[i] < v2[j]) {
                i++;
            } else {
                j++;
            }
        }
        vPair.push_back(close);
        v1.erase(v1.begin() + indexs.first);
        v2.erase(v2.begin() + indexs.second);
        i = j = 0;
        minDiff = std::numeric_limits<T>::max();
    }
    return vPair;
}
int main() {
    std::vector<double> v1 = {1,4,5,7,8,13,49};
    std::vector<double> v2 = {7,10,11,15,40};
    std::vector<std::pair<double,double>> result = getClosestPairs(v1,v2);
    for(auto [a,b] : result) std::cout << a << ',' << b << '\n';
}

输出:

7,7
8,10
13,11
5,15
49,40
,

在我看来,最好的算法是:

  1. 使用两个索引器进行迭代(递增指向较低数字的索引器)
  2. 如果增加的索引器更改=>您处于本地最小值 检查其是否低于最佳结果,或者:

2.1已经有了更好的最小值->忽略它
2.2另一个最佳变化量->记录
2.3优于我们的最佳增量->清除结果并记录新的最小值

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...