在python3.x

问题描述

我正在研究一些代码，以基于边界框选择和导出地理数据。我要选择的数据来自一个覆盖整个荷兰的巨大文件GDB（16GB）中的2个单独的层。我使用边界框来避免在选择之前读取整个数据集。

此方法在gpkg数据库上应用时效果很好，但是使用文件地理数据库时，处理时间要长得多（对于200x200米的选择，处理时间为0.2秒与300秒）。我正在使用的File GDB为正在读取的图层设置了空间索引。我正在使用geopandas进行阅读和选择。在下面，您将找到“ Adres”图层的示例：

import geopandas as gpd

def ImportGeodata(FilePath,BoundingBox):
    importBag=gpd.read_file(FilePath,layer='Adres',bBox=BoundingBox)
    importBag['mergeid']=importBag['identificatie']
    return importBag

我在监督什么吗？还是从庞大的File GDB导入时这是一个限制？我在这里找不到明显的错误。目前，解决方法是另一个脚本，该脚本可以在gpkg中导入和转储我需要的图层。问题是这需要运行3到4个小时（gpkg结果几乎为6 GB）。我不想继续这样做，有必要每个月左右执行一次，以便处理该数据集的新版本。

很好奇你们想出什么。

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

fiona geopackage geopandas python-3.x