如何从docx中提取表格和文本?

问题描述

我正在使用 pydocx 库从 Docx 文件提取文本和表格。我必须从 doc 文件中分别提取文本和表格,这会产生将表格数据与文本内容链接起来的问题。

e.g.

text

There are two types of merchant roles:  standard merchant and admin merchant. The standard merchant user will be a subset of the admin merchant user. The app will be common for both roles but component visibility will differ based on the merchant type. The following table defines access control for different merchant roles:

Table
Module  Standard Merchant   Admin Merchant
Login   Y   Y
Register    NA  Y
Dashboard   Y   Y
Voucher List    N   Y
Create Voucher  N   Y
Scan Voucher    N   N
Personal Details    Y   Y
Bank Details    N   Y
Setup Team  N   Y
Notifications   Y   Y
Change Password Y   Y
Help & Support  Y   Y
Privacy Policy  Y   Y

我想在一次调用提取上述数据。这可能吗?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...