PDF.js是否提取任何页面样式信息?

问题描述

我处于一种情况,在扫描文档中的文本后,我需要区分PDF是否具有特定的布局。 PDF.js是否可行?如果可以,我在哪里可以找到此信息?

解决方法

不幸的是,PDF包含非常低级的绘图命令,因此,无论使用哪种工具/库,从它们中提取任何格式信息都非常困难。 (例如,参见here

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...