问题描述
我们正在生产前评估tesseract OCR。 我们已经安装了tesseract exe(C ++),并计划使用TPL通过.NET进程进行调用。
由于将有多个输入图像,因此具有16个核心Windows机器,并计划将TPL的MaxDegreeOfParallism设置为与核心数相同,即16个以快速处理图像并尽可能多地利用CPU
从Tesseract文档中可以得知,“ Tesseract使用4个线程进行OCR处理”。
我们的理解是Tesseract使用4个线程进行单图像OCR处理。
因此,我们以以下2种情况执行了.NET POC应用程序-
1.输入图像= 100,OMP_THREAD_LIMIT = 4,MaxDegreeOfParallism = 16
2.输入图像= 100,OMP_THREAD_LIMIT = 1,MaxDegreeOfParallism = 16
但是发现速度几乎相同。我们看不到OMP_THREAD_LIMIT的影响。如果您知道使用tesseract加速数百万张图像的OCR处理的更好方法,请提出建议?
致谢
维杰
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)