python – 使用pyzmq零拷贝共享数据

python搜索IPC的有效解决方案时,我偶然发现了zeromq;我有几个python进程需要对来自主进程中的di​​ct的数据进行一些cpu密集处理.这些工作进程只读取dict,只有主进程才能改变dict. dict中的数据会发生变化,但会通过主进程自动进行.

理想情况下,我有一块共享内存,其中所有工作进程都可以读取dict,不幸的是这在python中似乎不可能.

使用像redis或memcache这样的缓存听起来像是矫枉过正(不想使用TCP& pickling来分享我已经在内存中以原生格式存在的东西)..

因此,作为替代方案,我想使用zeromq将主dict中的相关数据推送到使用zeromq IPC套接字的订阅工作者.这意味着我(不幸)必须从主dict序列化相关部分(使用msgpack?)然后使用zmq消息推送它.我读过可以使用零拷贝执行此操作,这样我就不会最终复制数据两次,如果我在msgpacked二进制字符串上使用copy = False,这会自动发生吗?这是解决我的问题的方法,或者你们有提示如何更有效地解决这个问题?

谢谢!

马亭

解决方法

是的,如果您发送带有copy = False的msgpacked字节,则发送过程中将不会有额外的数据内存副本(对于接收方,copy = False也是如此).

确保进行性能测试,因为更复杂的零拷贝机器的成本通常大于拷贝本身的成本,直到消息开始变得相当大(每个消息交叉大约10sb).

另一种方法是你可以使用内置的多处理模块facilities for shared data.它不是最棒的,但对于相当简单的事情,它可以完成工作.

相关文章

我最近重新拾起了计算机视觉,借助Python的opencv还有face_r...
说到Pooling,相信学习过CNN的朋友们都不会感到陌生。Poolin...
记得大一学Python的时候,有一个题目是判断一个数是否是复数...
文章目录 3 直方图Histogramplot1. 基本直方图的绘制 Basic ...
文章目录 5 小提琴图Violinplot1. 基础小提琴图绘制 Basic v...
文章目录 4 核密度图Densityplot1. 基础核密度图绘制 Basic ...