如何在数据着色器热图中填充或内插稀疏数据空白空间欠采样？

问题描述

在 datashader 中绘制一组数据时，如果 X 轴有离散数字和欠采样，它会在可以看到背景的列之间留下间隙。

我一直在尝试通过尝试设置更大的点大小或使用 dynspread 传递函数来解决此问题。不走运 - 很可能是我不知道应用这些的正确方法。

这是重现我的意思的示例代码：

import pandas as pd
import numpy as np

import datashader as ds,colorcet
import holoviews as hv
from holoviews.operation.datashader import datashade
from holoviews import opts

# generate random dataset 0 - 10000
image = np.random.randn(250,1024,1024) + 10000
z,x,y = image.shape
print("z,y =",z,y)
    
# rearrange data to 'z' + 'value' array and convert to dataframe
arr = np.column_stack((np.repeat(np.arange(z),y*x),image.ravel()))
df = pd.DataFrame(arr,columns = ['X','Y'])

### Plot using in datashader
map = ds.Canvas(plot_width=800,plot_height=800)
agg = map.points(df,'X','Y' )
pts = ds.tf.shade(agg,cmap=colorcet.fire)
ds.tf.set_background(pts,'white')

当然，使用散景绘制同一组显示相同的内容。更糟糕的是，如果你放大：

hv.extension("bokeh")
datashade(hv.Points(df),cmap=colorcet.fire).relabel('Value heatmap').opts(height=700,width=800)

解决方法

Datashader 在这种情况下按设计工作。当将点渲染到栅格网格中时，它会向您显示可用的实际点数据，直至像素网格可以显示的限制。如果一个像素中有多个数据点，它们的计数或值将被聚合。如果某些像素中没有数据，则不显示数据。

听起来您想要一种与数据阴影像素热图不同的绘图。也许：

如果您的数据代表来自底层栅格或四边形网格的常规样本，请使用数据阴影 hv.Image 或 hv.Quadmesh 图（或直接调用 canvas.raster 或 canvas.quadmesh），而不是 hv.Points或 canvas.points 图
如果您的数据代表来自基础连续分布的任意位置的样本，您可以在计算 Delaunay 或其他类型的三角剖分后使用数据阴影 hv.TriMesh 或 canvas.trimesh 图填充点之间，以便它定义一个表面。
如果您的数据表示来自非连续分布的任意位置的样本，但您仍想用连续函数对其进行近似，则可以使用（非数据阴影）hv.Bivariate 图，它计算平滑的核密度估计可以像您描述的那样有效地“连接点”，但也可以消除局部密度差异。

这些选项都没有完全满足您在此处的要求，但我认为 TriMesh 的行为将与您建议的最相似，同时在缩小情况下的行为仍然相似。

datashader python