在 Python C 扩展中使用来自 PyObjects 的数据而不持有 GIL

问题描述

在我的 Python C 扩展中，我正在对可迭代的字符串执行操作。因此，第一步我调用 PySequence_Fast 将其转换为列表，然后遍历元素。对于每个字符串，我使用 PyUnicode_DATA 然后使用一些标准比较字符串。所以我只从 PyObjects 中读取，但从不修改它们。

现在我想并行处理列表，这需要我释放 GIL。但是我不知道这对我的用例有什么影响。以下是我目前的想法：

我仍然可以使用这些 API，因为它们只是宏，可以直接从 PyObjects 读取而无需修改它们。
我必须事先使用 API 并存储一个包含 kind、length 和 data pointer 字符串的结构数组
我必须事先使用 API，并且必须将字符串的副本存储在数组中

案例 1 将是最高性能和内存效率的。但是声明，如果没有获得 GIL，则不允许在 Python 对象上执行（这是否包括读取访问）或使用 Python/C API 函数。

案例 2 将是下一个最有效的，因为至少我不必复制所有字符串。但是，当 GIL 发布时不允许我从 Python 对象中读取数据时，我想知道是否甚至允许我使用指向 PyObject 内部数据的指针。

案例 3 需要我复制所有字符串。就我而言，这可能会使多线程解决方案比顺序解决方案慢。

我希望有人能帮助我了解在 GIL 发布期间我可以做什么。

解决方法

我认为官方的回答是你不应该使用方法 1，而应该使用方法 2 和 3。虽然它现在可能有效，但在未来可能改变并破坏。如果您想支持 PyPy 的 C-API 包装器（它可能在内部使用与 Python 不同的表示形式），这一点尤其重要。有 increasing moves to try to hide implementation details 可能会被您发现。

实际上，我认为方法 1 可以正常工作，前提是您只使用没有错误检查的宏形式 - GIL 主要是关于停止同时写入，将 Python 对象置于未定义状态，而您没有这样做。我会稍微小心的是，如果您曾经（不推荐使用）“非规范”unicode 对象 - 看起来像 PyUnicode_READY 这样“宏”的东西可能会导致它们被修改为规范状态。同样，要特别警惕 C-API 的替代（非 CPython）实现。

要考虑的一种替代方法是改用 buffer protocol。虽然我在文档中找不到明确说明，但想法是 PyObject_GetBuffer 和 PyBuffer_Release 需要 GIL，但读/写缓冲区不需要。这里我有两个子建议：

你能有一个像 Numpy 数组这样的单一对象，将你的所有字符串作为缓冲区公开吗？
您还可以从 unicode 对象（作为 utf-8 C 字符串）获取缓冲区 - 要做的事情是使用 GIL 创建所有缓冲区，不进行并行处理，然后使用它们释放它们吉尔。这样做的开销可能效率低下。这基本上是方法 2 的“官方”版本。

简而言之，您可能会侥幸逃脱，但如果它发生故障，我怀疑向 Python 提交的错误报告是否会受到欢迎（因为它在技术上是错误的）

python python-3.x python-c-api