尝试使用python3从.pdf文件中提取地理坐标

问题描述

我试图在Ubuntu操作系统中使用python3从.pdf文件中以UTM格式提取地理坐标,并使用以下代码:

from pathlib import Path
import textract 
import numpy as np
import re
import os
import pdfminer

def main(_file):
    try:
        text = textract.process(_file,method="pdfminer")
    except textract.exceptions.ShellError as ex:
        print(ex)
        return
    with open("%s.csv" % Path(_file).name[: -len(Path(_file).suffix)],"w+") as _file:

# find orders and DNIs

        coords = re.compile(r"\d?\.?\d+\.+\d+\,\d{2}")                                                                                                                                                               
        results = re.findall(coords,text.decode())
        if results:
            _file.write("|".join(results))

if __name__ == "__main__":
    _file = "/home/cristian33/python_proj/folder1/buscarco.pdf"
    main(_file)

当我运行它时,出现以下错误:

命令pdf2txt.py /home/cristian33/python_proj/folder1/buscarco.pdf失败,因为可执行文件 pdf2txt.py未安装在您的系统上。请做出来 确保在使用之前安装了适当的依赖项 textract:

http://textract.readthedocs.org/en/latest/installation.html

有人知道为什么会出错吗?

谢谢

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...