从pytesseract释放内存

问题描述

我正在尝试简化一段时间以来一直在进行的OCR项目。目前，我正在对该功能进行性能分析，该功能首当其冲，并且我认为我的代码段在减少内存方面可以得到改善。

以下是我认为需要改进的内存分析器的代码片段结果。最相关的两条线是796和802。如果线802中的方向不为0，则线796将检测图像的方向并旋转。但是，稍后会在线818/819中通过{{ 1}}和del img。不幸的是，我无法释放由gc.collect()的{{1}}函数使用的第796行分配的内存（正如我试图在808/809行中所做的，尽管没有释放内存）。在确定页面方向时，该工具一直是我使用的最一致的工具，但我想知道是否存在一种占用较少内存的替代方法。

PyTesseract

此外，我了解到〜30MB的内存使用量增量并不大，但是在某些情况下，我需要将页面方向调整为最多80张图像，这意味着总内存增量为2.4GB。我已经尝试测试了56张图像，但是我的程序在第34张图像上抛出了img_to_osd内存不足错误，因为它无法再分配内存了。

人们是否可以建议一些技巧以最大程度地减少RAM使用率或关于为什么我无法如上所述释放第808行中的内存的想法？

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

ocr python python-tesseract