在 pdf 页面上搜索的最佳方式是什么

问题描述

我正在尝试创建一个基于 ocr 网络的 pdf 查看器,用户可以在其中搜索手写文本。 对于 search 功能,我将 pdf 图像发送到 django 服务器,在那里它使用 tesseract 来识别图像中的文本并返回一个字典,其中键是单词,值是坐标。 我很困惑如何使用该词典来显示结果(该词典给出了整个页面的单词及其坐标)。我尝试了 Boyer Moore 算法,但为此我需要在用户端将整个字典转换为字符串。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)