如何将tessdata_best用于tesseractpytesseract有哪些论据和程序?

问题描述

TL; DR:如何在tessdata_best的{​​{1}}内安装PyTesseractconda一起使用?

我已经在Ubuntu 18环境中使用过PyTesseract了,但是需要提高准确性,我发现conda可以为您提供最佳的准确性。如何安装和使用该版本?我正在使用tessdata_best,必须使用Ubuntu 18

我的PyTesseract安装在tesseract上,里面只有1个/usr/share/tesseract-ocr/

我是否需要通过将github上的tessdata复制到与tessdata_best一起的目录/usr/share/tesseract-ocr/中来获取

即使如此,如果我想使用tessdata,我还必须使用什么?我需要将tessdata-best更改为config吗?

第三件事是,我的--oem 0/1/2/3文件位于language.trainedata。我也需要在此位置粘贴/home/deshwal/anaconda3/envs/py36/share/tessdata/eng.traineddata吗?因为当我尝试更改语言目录时,它给我的错误是:

tessdata_best

解决方法

我不知道我是否清楚地理解了您的问题,但是请告诉我以下内容是否有帮助... 您需要将数据路径设置为要复制tessdata_best训练模型的位置,例如,

Tesseract tesseract =新的Tesseract(); // JNA接口映射 tesseract.setDatapath(“ / home / tesseract / tessdata_best_4_0_0 / tessdata”);

从(https://github.com/tesseract-ocr/tessdata_best)下载的所有.traineddata文件都应放置在您在setDataPath中定义的目录中(例如,/ home / tesseract / tessdata_best_4_0_0 / tessdata)。

请注意:这些模型仅适用于Tesseract 4的LSTM OCR引擎,因此请确保您使用的库为4.1或更高版本。

关于, 毛利克