问题描述
我正在尝试从 电子签名的 PDF 表单 中提取字段名称和相应的字段值,我将其上传到 Adobe Sign 并获得了电子签名。 请参阅链接:https://documentcloud.adobe.com/us/en/。
在上传 PDF 表单之前,它是一个 Acroform,即包含表单字段的可编辑 PDF。
从 Acroform PDF,我能够使用 PDFTK 提取字段名称和字段值。此外,在 Adobe Reader 上签署此表格后,虽然 PDF 不再可编辑(字段被锁定),但我仍然可以使用 PDFTK 从 PDF 文档中提取数据。
但是,在使用 Adobe Sign 请求和获取签名后,我正在努力使用 PDFTK 和 Python 提取字段名称和值。 Adobe Sign 确实单独提供了表单字段,但我正在寻找一种使用 Python(可以在 .py 脚本中包含像 PDFTK 这样的 shell 命令)从电子签名的 PDF 文档本身中提取字段名称和值的解决方案。
是否有人能够使用 Python 提供解决方案来提取此文档的字段名称及其对应值(包括留空的字段)?
尝试使用以下 Adobe 签名 PDF 表单: https://drive.google.com/file/d/1r57yrPuvzYlXwg-0KPM9UQGhu8jgWcUs/view?usp=sharing(使用 Adobe Sign 签名) https://drive.google.com/file/d/12NUyk7Jku4O1owBboyiCmk2ckpq8g26T/view?usp=sharing(无签名)
我也为另一个 Acroform 尝试了这个,但遇到了同样的问题。 https://www.pruadviser.co.uk/pdf/PIPF10000.pdf
解决方法
您将无法从 Adobe Signed PDF 中提取字段名称或值,因为文档不再具有字段。这是一个“扁平化”的PDF。文档中唯一的字段是持有证书的数字签名字段。您唯一的选择是使用 Adobe Sign API 以 CSV 文件形式获取字段数据...
/agreements/{agreementId}/formData