从pytesseract释放内存

问题描述

我正在尝试简化一段时间以来一直在进行的OCR项目。目前,我正在对该功能进行性能分析,该功能首当其冲,并且我认为我的代码段在减少内存方面可以得到改善。

以下是我认为需要改进的内存分析器的代码片段结果。最相关的两条线是796和802。如果线802中的方向不为0,则线796将检测图像的方向并旋转。但是,稍后会在线818/819中通过{{ 1}}和del img。不幸的是,我无法释放由gc.collect()的{​​{1}}函数使用的第796行分配的内存(正如我试图在808/809行中所做的,尽管没有释放内存)。在确定页面方向时,该工具一直是我使用的最一致的工具,但我想知道是否存在一种占用较少内存的替代方法

PyTesseract

此外,我了解到〜30MB的内存使用量增量并不大,但是在某些情况下,我需要将页面方向调整为最多80张图像,这意味着总内存增量为2.4GB。我已经尝试测试了56张图像,但是我的程序在第34张图像上抛出了img_to_osd内存不足错误,因为它无法再分配内存了。

人们是否可以建议一些技巧以最大程度地减少RAM使用率或关于为什么我无法如上所述释放第808行中的内存的想法?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)