有没有办法在不使用 Python API例如通过 C、Rust 等的情况下执行 PyObject 的深层复制?

问题描述

我想知道是否有人知道我可以用来在不使用 Python API 的情况下执行 PyObject 的深层复制的实现/库。

我更喜欢 C 语言(正如我目前使用的那样,并且对 CFFI 有点熟悉),但是任何语言(无论语言 - 例如 RUST),都将不胜感激。

这样做的原因是,我正在尝试对 Python 变量进行分析(对于实时 Python 调试库),但不想在被分析的程序执行期间执行分析(因为这会极大地影响程序性能)。

如果我可以在执行后(但在程序终止之前)分析变量,那将非常有帮助。为了做到这一点,我需要将变量保存在其他一些线程中(最好是不需要 GIL 的 C 程序 - 以便主 Python 程序可以不间断地继续执行)。

我个人认为没有任何东西,因为我已经看过了,但我认为值得在 Stack Overflow 上询问某人。

谢谢。

解决方法

在 C 中有 memcpy 用于制作结构的深层副本,structs 是您可以获得的与 OOP 中的对象最接近的等价物。因此,如果您可以获得内存中 Python 对象的大小及其内存位置,则可以使用 memcpy() 对其进行深度复制 (Deep copying array in C... malloc?,Making a deep copy of a struct...making a shallow copy of a struct)。您可以通过编写附加模块 (https://docs.python.org/3/extending/extending.html) 或 cython (https://cython.readthedocs.io/en/latest/src/userguide/external_C_code.html) 之类的机制在 Python 中执行此操作

但是,如果 Python 对象包含指向子结构的指针,memcpy 将不会产生深拷贝 (C++ deep copying with objects) 在这种情况下,您必须为 Python 对象的副本分配内存并手动复制每个子结构

https://agiledeveloper.com/articles/cloning072002.htm - 为什么复制对象是一件可怕的事情?

更新:

如评论中所述,使用 C memcpy 不是最佳解决方案,因为可能实现为指针的子结构。因此,也许可以尝试使用 Python 的 copy 模块 ( https://pymotw.com/2/copy/ ) 或分析其源代码并根据您的需要进行调整