我需要读取/解析文本内容并获取字体详细信息.请建议.
http://www.unixuser.org/~euske/python/pdfminer/index.html.
pdftext.py为您提供从pdf中提取的文本,它还为您提供其他信息,如字体和字体大小等.
你可以试试.
注意:不支持Python 3