c – 查找数组中最大量级元素的MSB集

给定一个类型为short short的len元素数组,可以找到数组中最大绝对值元素中设置的最高有效位的位置.例如,如果数组L包含{-134,123,-890},则f(L)应返回floor(log2(abs(-890)))1.

这是我目前的功能

short MSBSetMaxMagnitude(const short *p,int len)
{
   unsigned int t = 0;

   while (len > 0)
   {
      t |= abs(*p);
      p++;
      len--;
   }
   if(t)
      return (short)(32 - __builtin_clz(t));
   else
      return 0;
}

但是,由于abs()函数需要分支,因此速度有点慢.我尝试使用没有分支的abs(),但它甚至更慢,因为它包含至少3个算术指令.所以我希望有一种有效的算法可以找到我需要的东西.

解决方法

看到您在ARM平台上工作,您可以在2条指令中使用abs的以下实现:

EORS r1,r1,ASR #32 (x = x ^ (x >> 32); carry_flag = sign_bit)
ADC r1,#0           (add the sign_bit to x)

如果在计算中可以容忍/ -1的错误,则删除第二条指令;那么,你可以用C表达它:

int abs_almost_exact(int x)
{
    return x ^ (x >> 32);
}

但更大的问题是循环.您可能会从展开中获益很多(因为每次迭代都没那么做):

do { // assuming len is even!
    int value1 = *p++;
    int value2 = *p++;
    value1 = abs(value1); // or replace abs by the hand-made version
    value2 = abs(value2);
    t |= value1;
    t |= value2;
    len--;
}
while (len > 0);

注意:由于我使用的编译器(ARM编译器)以这种方式生成更好的代码,因此我将{}替换为{}.

还请注意,从内存加载短变量(在我使用的处理器上)时,ARM有2个时钟周期的延迟.因此,最小展开因子是3(但你应该尽可能多地展开).

哦,你的处理器是否支持从内存中读取短(半字)变量?我听说过一些非常古老的处理器无法做到这一点.如果您遇到这种情况,则应该将代码更改为一次加载2个值(1个字),并使用一些比特来分隔它们.

相关文章

本程序的编译和运行环境如下(如果有运行方面的问题欢迎在评...
水了一学期的院选修,万万没想到期末考试还有比较硬核的编程...
补充一下,先前文章末尾给出的下载链接的完整代码含有部分C&...
思路如标题所说采用模N取余法,难点是这个除法过程如何实现。...
本篇博客有更新!!!更新后效果图如下: 文章末尾的完整代码...
刚开始学习模块化程序设计时,估计大家都被形参和实参搞迷糊...