在不包含时间维度的文件上使用 xarray open_mfdataset

问题描述

我有一个要使用 xarray.open_mfdataset 函数打开的 NetCDF 文件列表。

这通常是微不足道的,但是我遇到了一个问题,因为我尝试打开的文件中没有包含任何“时间”维度:

data
Out[51]: 
<xarray.Dataset>
Dimensions:  (lat: 850,lon: 1500)
Coordinates:
  * lat      (lat) float64 54.98 54.94 54.9 54.86 ... 21.14 21.1 21.06 21.02
  * lon      (lon) float64 -126.0 -125.9 -125.9 -125.9 ... -66.1 -66.06 -66.02
Data variables:
    Data     (lat,lon) float32 ...

当我尝试用 open_mfdataset 打开我的文件列表时,我当然得到一个错误

xr.open_mfdataset(files)

ValueError: Could not find any dimension coordinates to use to order the datasets for concatenation

但是我确实有一个与每个文件对应的日期列表:

dates
Out[54]: 
array([datetime.datetime(2009,1,0),datetime.datetime(2009,2,3,...,datetime.datetime(2019,12,29,30,31,0)],dtype=object)

我假设有某种方法可以为每个文件添加一个时间维度,并使用 open_mfdataset 打开它们,可能使用“预处理”参数。

感谢您的帮助。

解决方法

这是我的解决方案:

创建一个向 DataArray 添加时间维度的函数,并用任意日期填充它:

def add_time_dim(xda):
    xda = xda.expand_dims(time = [datetime.now()])
    return xda

然后,在运行 preprocess 函数时将此函数传递给 open_mfdataset 参数:

data = xr.open_mfdataset(files,preprocess = add_time_dim)

最后,用我的日期填充 time 维度:

data['time'] = dates