问题描述
我正在尝试使用HLSL在GPU上进行邻居处理,我想知道是否有一种方法可以一次加载一组neigbour样本,而不仅仅是一个样本,因此我可以利用矩阵数学代替循环。
我当前使用SampleLevel函数的实现类似于:
float3 pixel = inputTex.SampleLevel(sampleState,uv + uvOffset,0.0,0.0);
相反,我想一次加载多个示例,但是我还没有找到用于该示例的API。或者,如果我的方法完全错误,请让我知道在HLSL中利用向量化和矩阵数学的其他方法。感谢您的任何建议,祝您度过愉快的一天!
解决方法
据我所知,从单一纹理访问中可以得到的最大值是float4。
您的选择是(假设您仅需要4个相邻值):
- 调用4种加载方法(需要texel整数坐标,而不是UV)。
- 使用点采样器调用4个采样方法(要求将UV偏移0.5 / textureSize,因此您的采样将是(u-偏移量,v-偏移量),(u +偏移量,v-偏移量),(u-偏移量,v +偏移),(u +偏移,v +偏移))
- 如果纹理是单通道(或仅需要红色通道),则可以使用Gather-https://docs.microsoft.com/en-us/windows/win32/direct3dhlsl/dx-graphics-hlsl-to-gather