从模板参数中提取 simd-vector 长度以用于本地类型

问题描述

我正在努力寻找正确的 C++/clang 话语来解决以下问题。首先请注意,由于在算术发生之前的整数提升,以下内容不会溢出 unsigned short。

unsigned short testme = 16320;
testme = testme * 257 / 64;

结果是 65535。但是当我使用 simd 在无符号短裤向量上尝试类似的东西时,它不起作用:

#import <simd/simd.h>

template <typename T>
  void muldiv( T* data,unsigned multiply,unsigned divide)
{
    *data = (*data * multiply) / divide;
}

...

simd::ushort4 testme = 16320;
muldiv( &testme,257,64);

这给出了四个 1023 的向量。没有发生整数提升并且乘法被包裹。在查看了 clang 文档之后,我能想到的最好的就是这个。请注意,调用者必须提供一个虚拟参数,以提供工作精度作为模板类型参数。

#import <simd/simd.h>

template <typename T,typename W>
 void muldiv( T* data,unsigned divide,W workingtype)
{
    *data = __builtin_convertvector( (__builtin_convertvector(*data,W) * multiply) / divide,T);
}

...

simd::ushort4 testme = 16320;
muldiv( &testme,64,simd::uint4());

现在我得到了一个由四个 65535 组成的向量。 T 是模板参数的原因是有时我传递 ushort4、ushort8、ushort16 等。但我发现将工作精度作为参数传递很丑陋,因为它总是 unsigned int。我想不出从 T 中提取 simd-length 的方法,所以我可以在本地声明类型 W。在函数中这样的东西会很好:

typedef unsigned int W __attribute__((__vector_size__( ?? )));

但我不知道如何使它起作用。我试过这样的事情:

bool hopeful = __is_convertible_to( simd::ushort4,simd::uint4);

但希望总是返回false。

谁能告诉我我需要什么魔法?

请注意,这是在提供 的 Apple 平台上。

解决方法

因此,clang 允许您对属性进行模式匹配并在模板中生成新的属性修改类型。

所以我们可以这样做。

simd 宽度属性上的第一个模式匹配:

template<class T>
struct get_simd_width;

template<class T,std::size_t x>
struct get_simd_width< __attribute__((__ext_vector_type__(x))) T >:
  std::integral_constant<std::size_t,x>
{};

另外,提取属性类型的基础类型:

template<class T>
struct get_simd_type;

template<class T,std::size_t x>
struct get_simd_type< __attribute__((__ext_vector_type__(x))) T >
{
  using type = T;
};

然后我们做了一些语法糖来使它们更易于使用:

template<class T>
constexpr std::size_t simd_width = get_simd_width<T>{};
template<class T>
using simd_type = typename get_simd_type<T>::type;

这是生成一个带有属性的新 simd 类型:

template<class T>
struct simd_helper;
template<class T,std::size_t N>
struct simd_helper<T[N]> {
  using type = __attribute__((__ext_vector_type__(N))) T;
};
template<class T>
using simd = typename simd_helper<T>::type;

然后 simd<int[4]> 生成宽度为 4 的 simd 类型。

那些应该可以解决您的问题。 Live example

template <class T>
void muldiv( T* data,unsigned multiply,unsigned divide)
{
   using W = simd<int[simd_width<T>]>;
   *data = __builtin_convertvector( (__builtin_convertvector(*data,W) * multiply) / divide,T);
}