如何使用 xarray 中的维度和数据来创建新的数据数组?

问题描述

我在 Xarray 中遇到数据集问题。我想对数据集中已有的数据和坐标应用一个函数来计算一组新的数据(本质上,w = f(x,y 、z),其中 xyz 是浮点数。

有一系列的函数需要应用,当拉入一个新的变量时,结果数组的维度需要扩展。所以f(x)应该是一个一维数组,g(f(x),y) 应该是 2D 的,而 h(g(f(x),y),z) 应该是从之前的 2D 数组创建的 3D 数组。我可以使用 np.outer 强制进行 1D -> 2D 转换,但在 2D -> 3D 转换时遇到问题。鉴于我遇到了很多麻烦,我怀疑我是从错误的方向来解决问题的。

下面是部分代码的片段。有人可以帮助我从 NumPy/Xarray 的角度理解解决这个问题的正确方法吗(我真的试图避免陷入这个工作的循环......)

import numpy as np
import xarray as xr

data = xr.Dataset(
    data_vars={
        "abs": (("x"),np.ones((200)))
    },coords={
        "x": np.linspace(1.5,1.55,200),"y": np.arange(5e5),"z": np.arange(125)
    }
)

def intensity_decay(da):
    "Return decay curve (exponential decay)."
    init_power = 1e5
    decay = init_power * np.exp(
        -1 * np.outer(da.abs,da.y * 10 ** (-7))
        )
    decay[decay < 1e-3] = 0
    return decay

data["depth_decay"] = (["x","y"],intensity_decay(data))

def radial_decay(da):
    "Return radial decay curve."
    return np.outer(da.depth_decay,np.exp(-da.z))

radial_decay(data.isel(x=[1,4,10])).shape

如您所见,radial_decay 函数不会广播到 z 维度。似乎 Xarray 应该支持这种类型的操作,但我不知道如何解决这个问题,甚至不知道从文档中的哪里开始。我目前有两个数据集,我想应用这些函数,所以我可以手工完成,但我想制作一个框架,我也可以在未来的数据上使用。

解决方法

在玩了一会儿并使用 this answer 中的函数结构之后,我能够想出一个正确形状的输出。

通过如下定义radial_decay函数,我可以得到一个具有三个维度的输出数组。

def radial_decay(da):
    "Return radial decay curve."
    da["radial_decay"] = (["x","y","z"],da.depth_decay * np.exp(-da.z))
    return da

使用此结构,radial_decay(data.isel(x=[1,4,10])).radial_decay.shape 的输出为 (3,500000,125),而不是使用原始问题中定义的函数的 (1500000,125)

虽然这似乎有效(我仍然需要验证 是否正确),但我想知道是否还有其他(更好的?)方法来实现这个目标,特别是如果只是 NumPy 有更好的方法来做到这一点(以防我将来由于某种原因无法访问 Xarray)。