有没有一种方法可以自动标记具有特定页面布局的页面或获得正确的阅读顺序?

问题描述

很抱歉,如果有人在其他地方问过这个问题,我看了一下,但是找不到答案。我每天都在工作中每天处理美国专利PDF。 PDF是从TIFF图像创建的,开头没有识别文本,没有有用的标签等。我遇到的问题是,自动添加标签功能会使识别页面元素的错误太多。有时,它将一列文本标记为表格。有时,它会将两个并排的列标记为一个大表,等等。

由于这些页面元素在成千上万的文档中保持不变,有没有办法让我告诉Acrobat我希望标签的内容如何?例如,总有一列文本,其高度为9.25英寸乘3英寸宽,其上角距页面顶部1 1/6英寸,距页面1 1/12英寸。我希望能够自动将页面的此区域识别为单个文本列,而不必每次自行修复。这可能吗?非常感谢您的帮助。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...