在python的netCDF文件中提取特定纬度/经度的检测日期/时间

问题描述

我目前正在使用python中的多个netCDF文件。我正在大伦敦地区使用Sentinel-5P NO2对流层色谱柱。我想将单个文件绘制为一个时间序列,以每个单独的条带在伦敦的逾越时间为标题,但是我不确定如何提取文件

是否有一种简单的方法可以提取每个文件在特定纬度/经度上的卫星通过时间?

编辑: 有关文件的更多信息。它们是netCDF文件,意味着它们包含尺寸,变量,属性和坐标。它们包含有关3.5x7km空间分辨率的伦敦NO2垂直柱密度的信息。我在PyCharm中使用xarray打开了文件,并进一步附加了图像以提供有关变量的更多信息。

enter image description here

当纬度= 51.2或51.8时,我基本上需要找到delta_time的值。以下是到目前为止我开发的内容,但是我有大约50个文件,所有文件都超过100,000像素,因此这非常慢。有谁知道我该如何改善?


    for i in file_list:

        # Open product - GROUP PRODUCT
        with xr.open_dataset(i,group='PRODUCT') as file:
            print(colored('\nPRODUCT Group:\n','blue'),file)

        no2 = file['nitrogendioxide_tropospheric_column'][0]

        for row in no2.coords['latitude']:
            for cell in row:
                if cell == 51.2 or cell == 51.8:
                    print(cell)
                    print(cell['scanline'])
                    scanpoint = (cell['scanline'])
                    scantime = no2['delta_time'].sel(scanline=scanpoint)
                    print(scantime)
                    return scantime
            else:
                continue

解决方法

您应该能够使用矢量化的NumPy函数执行所需的操作。现在,我不确定比较浮点数是否相等,但这应该与您的相似。我没有专门使用xarray,而是使用了netCDF4,所以它说<array>的意思是为该变量/坐标获取一个numpy(或等效的)数组。另外,请注意,我没有选择单个时间值,看起来像您选择的那样,但是只是使用了latitude s的整个3D数组。

import numpy as np

latitude = <3D latitudes array>
delta_time = <2D delta_time array>

# 3D boolean array with our required condition
condition = (latitude == 51.2) | (latitude == 51.8)

# Expand tuple of indices,one for each of the 3 dims,but ignore ground_pixel dim
# Each of these idx arrays is 1D
time_idx,scanline_idx,_ = condition.nonzero()

# Get 1D array of delta_times by using time and scanline indices
delta_times = delta_time[time_idx,scanline_idx]

这应该使您拥有所有三个维度上所有相关单元格的坐标(condition.nonzero(),以及这些单元格的delta_times

请注意,如果您不使用实际值,则不需要实际的no2数组,而只关心latitudedelta_time,但是您始终可以获取值像no2[condition]这样的相关单元格。