在 pdf 页面上搜索的最佳方式是什么

问题描述

我正在尝试创建一个基于 ocr 网络的 pdf 查看器，用户可以在其中搜索手写文本。对于 search 功能，我将 pdf 图像发送到 django 服务器，在那里它使用 tesseract 来识别图像中的文本并返回一个字典，其中键是单词，值是坐标。我很困惑如何使用该词典来显示结果（该词典给出了整个页面的单词及其坐标）。我尝试了 Boyer Moore 算法，但为此我需要在用户端将整个字典转换为字符串。

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

boyer-moore ocr ocr pdf pdf pdf search