问题描述
我正在尝试使用 tabula 包仅从 pdf 中提取表格并将输出写入 csv, 不幸的是,下面的代码给了我一个错误“NameError: name 'tabula' is not defined”
如何解决这个问题
代码:
!pip install tabula-py
from tabula import read_pdf
from tabula.io import read_pdf
file = r"url"
df = read_pdf(file,pages='all')
tabula.to_csv('output.csv',encoding='utf-8')
错误:
"NameError: name 'tabula' is not defined"
解决方法
这里有一个解释。每次使用 from module import function
时,它都会获取函数,而不是整个库和函数,因此如果要使用该 tabula.to_csv()
函数,则需要导入整个库,使用 {{1 }}。
其他方法:
您可以使用 import tabula
并使用 to_csv()
from tabula import read_pdf
from tabula.io import read_pdf
file = r"url"
df = read_pdf(file,pages='all')
tabula.to_csv('output.csv',encoding='utf-8') # from tabula import to_csv
您使用该方法但未导入,因此出现此错误