如何在HLSL中利用矩阵数学进行邻居处理?

问题描述

我正在尝试使用HLSL在GPU上进行邻居处理,我想知道是否有一种方法可以一次加载一组neigbour样本,而不仅仅是一个样本,因此我可以利用矩阵数学代替循环。

我当前使用SampleLevel函数的实现类似于:

float3 pixel = inputTex.SampleLevel(sampleState,uv + uvOffset,0.0,0.0);

相反,我想一次加载多个示例,但是我还没有找到用于该示例的API。或者,如果我的方法完全错误,请让我知道在HLSL中利用向量化和矩阵数学的其他方法。感谢您的任何建议,祝您度过愉快的一天!

解决方法

据我所知,从单一纹理访问中可以得到的最大值是float4。

您的选择是(假设您仅需要4个相邻值):

  • 调用4种加载方法(需要texel整数坐标,而不是UV)。
  • 使用点采样器调用4个采样方法(要求将UV偏移0.5 / textureSize,因此您的采样将是(u-偏移量,v-偏移量),(u +偏移量,v-偏移量),(u-偏移量,v +偏移),(u +偏移,v +偏移))
  • 如果纹理是单通道(或仅需要红色通道),则可以使用Gather-https://docs.microsoft.com/en-us/windows/win32/direct3dhlsl/dx-graphics-hlsl-to-gather