如何并行化贪婪分配问题

问题描述

我有一个大的 2D 成本 矩阵:500K x 500K,我想解决分配问题。除了匈牙利算法,我想使用下面的贪心算法来减少时间:

# H1,H2 in range(500K)
for n1 in H1:
    best = -1
    for n2 in H2:
        if cost[n1,n2] > best and n2 not in matched:
            aligned[n1]=n2
            best = cost[n1,n2]
    matched.append(aligned[n1])

使用一个内核将需要很长时间(对于 5Kx5K,单线程需要 40 分钟)。我想我们不能并行化嵌套循环,因为我们需要 best 变量。对? 我尝试将此代码并行化,但它给了我很多重复的列。

from joblib import Parallel,delayed
import multiprocessing

inputs = range(500000)
def processInput(i):
    row = cost[i,:]
    # cost[row,col[0][0]] = 10e5 ### not possible as read-only in multiprocessing
    return i,col


num_cores = multiprocessing.cpu_count()
row_col = Parallel(n_jobs=num_cores)(delayed(processInput)(i) for i in inputs)

有什么建议可以更快地运行贪婪算法(我的并行解决方案不起作用)?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)