问题描述
TL; DR:如何在tessdata_best
的{{1}}内安装PyTesseract
与conda
一起使用?
我已经在Ubuntu 18
环境中使用过PyTesseract
了,但是需要提高准确性,我发现conda
可以为您提供最佳的准确性。如何安装和使用该版本?我正在使用tessdata_best
,必须使用Ubuntu 18
。
我的PyTesseract
安装在tesseract
上,里面只有1个/usr/share/tesseract-ocr/
。
我是否需要通过将github上的tessdata
复制到与tessdata_best
一起的目录/usr/share/tesseract-ocr/
中来获取?
即使如此,如果我想使用tessdata
,我还必须使用什么?我需要将tessdata-best
更改为config
吗?
第三件事是,我的--oem 0/1/2/3
文件位于language.trainedata
。我也需要在此位置粘贴/home/deshwal/anaconda3/envs/py36/share/tessdata/eng.traineddata
吗?因为当我尝试更改语言目录时,它给我的错误是:
tessdata_best
解决方法
我不知道我是否清楚地理解了您的问题,但是请告诉我以下内容是否有帮助... 您需要将数据路径设置为要复制tessdata_best训练模型的位置,例如,
Tesseract tesseract =新的Tesseract(); // JNA接口映射 tesseract.setDatapath(“ / home / tesseract / tessdata_best_4_0_0 / tessdata”);
从(https://github.com/tesseract-ocr/tessdata_best)下载的所有.traineddata文件都应放置在您在setDataPath中定义的目录中(例如,/ home / tesseract / tessdata_best_4_0_0 / tessdata)。
请注意:这些模型仅适用于Tesseract 4的LSTM OCR引擎,因此请确保您使用的库为4.1或更高版本。
关于, 毛利克