问题描述
我正在研究一些代码,以基于边界框选择和导出地理数据。我要选择的数据来自一个覆盖整个荷兰的巨大文件GDB(16GB)中的2个单独的层。我使用边界框来避免在选择之前读取整个数据集。
此方法在gpkg数据库上应用时效果很好,但是使用文件地理数据库时,处理时间要长得多(对于200x200米的选择,处理时间为0.2秒与300秒)。我正在使用的File GDB为正在读取的图层设置了空间索引。我正在使用geopandas进行阅读和选择。在下面,您将找到“ Adres”图层的示例:
import geopandas as gpd
def ImportGeodata(FilePath,BoundingBox):
importBag=gpd.read_file(FilePath,layer='Adres',bBox=BoundingBox)
importBag['mergeid']=importBag['identificatie']
return importBag
我在监督什么吗?还是从庞大的File GDB导入时这是一个限制?我在这里找不到明显的错误。目前,解决方法是另一个脚本,该脚本可以在gpkg中导入和转储我需要的图层。问题是这需要运行3到4个小时(gpkg结果几乎为6 GB)。我不想继续这样做,有必要每个月左右执行一次,以便处理该数据集的新版本。
很好奇你们想出什么。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)