问题描述
有人知道如何一起使用获取文本和数据抓取并将其插入Excel吗?
我要在Excel中显示的是蓝色突出显示的内容,我可以使用数据交换来获取数据表,但无法将“ 104445”一起获取。
解决方法
您所拥有的是PDF中的表格数据与属性类型数据(信息以名称/值对形式出现)的组合。
有人知道如何一起使用获取文本和数据抓取并将其插入Excel吗?
您的第一部分已经开始工作。现在,只需将新活动添加到您的流程或工作流中,这些新活动将在提取表格数据后提取文本。将特定数据字段保留在变量中,然后仅使用Excel活动将DataTable和变量中包含的信息写入电子表格中。 Append Range
和Write Cell
Excel活动可能会解决问题。
表数据与名称/值对
UiPath data scraping函数非常适合表格数据。如您所知,它将一切带回DataTable
。单个数据需要更细粒度的数据提取。
对于104445,您需要结合使用get Text
函数和Anchor Base
函数。
- 您将
Anchor Base
函数添加到页面上。Anchor Base
需要添加两个活动才能正常工作。 - 第一个活动是
get Element
。这将在104445的左侧指定标签。 - 然后,您添加
get Text
活动以检索get Element
活动旁边的文本。这将提取104445。 - 然后将结果保存在String变量中,并根据需要使用它。
锚定基础活动示例
在以下UiPath Anchor Base
示例中,标签位于我要提取的文本上方,因此Anchor Base
活动将锚点位置设置为要提取的文本上方。在您的示例中,将其设置为指示锚点位于要提取的文本的左侧。
顺便说一句,您可以单独使用PDF get Text
活动而不使用Anchor Base
活动,但是如果您需要从multiple PDFs中提取数据,则可能无法正常工作,因为UiPath选择器将过于具体。如果您需要循环浏览多个PDF文件,则需要使用Anchor Base
活动。
仅带有标签的PDF
请注意此答案的任何人注意。为了抓取数据并使文本活动正常工作,必须对PDF进行标记。如果属性指示未标记PDF,则这些功能将不会始终如广告所示那样工作。此外,如果PDF实际上只是扫描的图像,则需要使用UiPath OCR工具。数据抓取和获取文本活动根本不起作用。
此外,为了使数据抓取或使文本活动正常工作,您很多人需要更改Adobe或FoxIt阅读器的阅读顺序属性以进行推断或标记。