问题描述
我目前正在使用python中的多个netCDF文件。我正在大伦敦地区使用Sentinel-5P NO2对流层色谱柱。我想将单个文件绘制为一个时间序列,以每个单独的条带在伦敦的逾越时间为标题,但是我不确定如何提取该文件。
是否有一种简单的方法可以提取每个文件在特定纬度/经度上的卫星通过时间?
编辑: 有关文件的更多信息。它们是netCDF文件,意味着它们包含尺寸,变量,属性和坐标。它们包含有关3.5x7km空间分辨率的伦敦NO2垂直柱密度的信息。我在PyCharm中使用xarray打开了文件,并进一步附加了图像以提供有关变量的更多信息。
当纬度= 51.2或51.8时,我基本上需要找到delta_time的值。以下是到目前为止我开发的内容,但是我有大约50个文件,所有文件都超过100,000像素,因此这非常慢。有谁知道我该如何改善?
for i in file_list:
# Open product - GROUP PRODUCT
with xr.open_dataset(i,group='PRODUCT') as file:
print(colored('\nPRODUCT Group:\n','blue'),file)
no2 = file['nitrogendioxide_tropospheric_column'][0]
for row in no2.coords['latitude']:
for cell in row:
if cell == 51.2 or cell == 51.8:
print(cell)
print(cell['scanline'])
scanpoint = (cell['scanline'])
scantime = no2['delta_time'].sel(scanline=scanpoint)
print(scantime)
return scantime
else:
continue
解决方法
您应该能够使用矢量化的NumPy函数执行所需的操作。现在,我不确定比较浮点数是否相等,但这应该与您的相似。我没有专门使用xarray,而是使用了netCDF4,所以它说<array>
的意思是为该变量/坐标获取一个numpy(或等效的)数组。另外,请注意,我没有选择单个时间值,看起来像您选择的那样,但是只是使用了latitude
s的整个3D数组。
import numpy as np
latitude = <3D latitudes array>
delta_time = <2D delta_time array>
# 3D boolean array with our required condition
condition = (latitude == 51.2) | (latitude == 51.8)
# Expand tuple of indices,one for each of the 3 dims,but ignore ground_pixel dim
# Each of these idx arrays is 1D
time_idx,scanline_idx,_ = condition.nonzero()
# Get 1D array of delta_times by using time and scanline indices
delta_times = delta_time[time_idx,scanline_idx]
这应该使您拥有所有三个维度上所有相关单元格的坐标(condition.nonzero()
,以及这些单元格的delta_times
。
请注意,如果您不使用实际值,则不需要实际的no2
数组,而只关心latitude
和delta_time
,但是您始终可以获取值像no2[condition]
这样的相关单元格。