问题描述
我想从一堆 PDF 文档中引用最后一页并从中解析表格,但是文档中的页数可能会有所不同。我所知道的是,这些文档的最后一页是相同的。
User::where('notification_preferences->expiry-alerts',true)->update(['notification_preferences' => [
'domains' => [
'expiry' => [
'mail' => true,'database' => true
]
]
]])
有没有一种优雅的方法来做到这一点,我不必为了到达最后一页上的表格而抓取文档中的所有页面?
解决方法
首先你应该得到页数,例如使用 pyPdf
import pyPdf
from tabula import read_pdf
reader = pyPdf.PdfFileReader(open(path,mode='rb' ))
n = reader.getNumPages()
all_tables_stream = tabula.read_pdf(path,password = password,stream = "True",pages = n)