如何使用单位移位有效地左移N位? 编辑

问题描述

某些MSP430等CPU没有多位移位,而只有一位移位或旋转指令。这让我很好奇,在过去的程序员中,他们所能做的就是一次移位一位。

我知道这样做的“愚蠢”方式:

#include <cstdint>

uint64_t lshift(uint64_t x,uint64_t shift) {
    for (uint64_t i = 0; i < shift; ++i) {
        x <<= 1;
    }
}

有什么方法可以做到这不具有O(n)的复杂性吗?还是至少有一种实现方式可以使我在编译时知道移位(通常是移位)?

我的直觉是x << (1 << (1 << 1))x << 4相同,因此也许可以通过组合这样的移位将其降低到O(log n)。

编辑

我的直觉是错误的,但是其他操作也会产生类似的效果。 x << 1等效于x += x,因此x += x,x += x,x += x等效于x << 4。乘以2的幂也可以。


注意:这里使用C ++只是为了方便起见,我知道总是会有一个左移运算符。我只是不想在MP430装配中考虑这一点。

解决方法

有关以下代码的背景信息,请在Internet上搜索“达夫设备”。

您可以通过以下方式使用switch语句:

uint32_t Shift_Value(uint32_t value,unsigned int shift_quantity)
{
  switch (shift_quantity)
  {
     case 31:
         value <<= 1;
     case 30:
         value <<= 1;
     case 29:
         value <<= 1;
// ...
     case  1:
         value <<= 1;
   }
   return value;
}

上面的代码很有趣,因为它是进入移位操作数组的跳转表。可以将其与展开for循环进行比较,但是它具有执行跳入“展开”的适当位置的优点。

我以前在嵌入式系统中使用过这种模式来提高性能。

我建议打印出编译器生成的汇编语言并研究汇编语言。 :-)

此外,由于没有循环,只有计算和跳转,因此优化可能是O(1)。

,

如果有乘数,那么

uint32_t multipliers[] = {1,2,4,8,16 ...};
uint32_t shift(uint32_t x,uint32_t shift)
{
    return x * multipliers[shift];
}
,

TL; DR:实际上,如您所想,多步转换通常会由多个转换完成。但是可以使用一些技巧来避免移动太多次。例如,某些算法被设计为只需要移位1,或者如果需要更大的移位,则可以使用ISA中的一些特殊的按位指令进行优化

为嵌入式系统编程需要更深入地了解该体系结构,以实现良好的性能和RAM / ROM使用率。例如,选择变量使它们适合机器字。除非绝对必要,否则没有人会在16位或8位MCU上使用uint64_t。多字变量的运算(包括位移)需要更多指令,因此通常不会内联。通常,对字大小倍数的移位与对数组元素进行移位相似,因此它们将非常快


按任意变量移动需要一个barrel shifter,比简单的shift register占用更多的裸片空间,因此大多数嵌入式体系结构一次只能移位一位。它们中的大多数还包括某种交换半字指令,以克服该限制并允许足够快的大距离移位。例如,诸如805​​1,PIC或AVR之类的8位微控制器具有交换半字节指令。参见:

MSP430是16位MCU,因此它具有一条SWPB指令来交换 bytes ,该指令可以类似地用于快速移位8。这里是some examples generated by Clang(加上我的评论,请注意如何完成8倍移位和大于8的移位):

shift_left_15(unsigned short):                     ; @shift_left_15(unsigned short)
        mov.b   r12,r12
        swpb    r12      ; swap bytes then shift left 7 times
        add     r12,r12
        add     r12,r12
        ret
shift_left_12(unsigned short):                     ; @shift_left_12(unsigned short)
        mov.b   r12,r12
        swpb    r12      ; swap bytes then shift left 4 times
        add     r12,r12
        ret
shift_left_10(unsigned short):                     ; @shift_left_10(unsigned short)
        mov.b   r12,r12
        swpb    r12      ; swap bytes then shift left 2 times
        add     r12,r12
        ret
shift_left_9(unsigned short):                      ; @shift_left_9(unsigned short)
        mov.b   r12,r12
        swpb    r12
        add     r12,r12
        ret
shift_left_8(unsigned short):                      ; @shift_left_8(unsigned short)
        mov.b   r12,r12
        swpb    r12      ; just swap bytes
        ret
shift_left_7(unsigned short):                      ; @shift_left_7(unsigned short)
        add     r12,r12
        ret
shift_left_3(unsigned short):                      ; @shift_left_3(unsigned short)
        add     r12,r12
        ret

您可以打开上方的Godbolt链接以获取完整的输出

如果您使用的是MSP430X,那么它可以从1 greatly simplifies the shifting procedure到4位位置

shift_left_15(unsigned short):
        PUSHM.W #1,R4
        MOV.W   R1,R4
        rpt     #15 { rlax.w      R12
        POPM.W  #1,r4
        RET
shift_left_12(unsigned short):
        PUSHM.W #1,R4
        rpt     #12 { rlax.w      R12
        POPM.W  #1,r4
        RET
shift_left_10(unsigned short):
        PUSHM.W #1,R4
        rpt     #10 { rlax.w      R12
        POPM.W  #1,r4
        RET
shift_left_9(unsigned short):
        PUSHM.W #1,R4
        rpt     #9 { rlax.w       R12
        POPM.W  #1,r4
        RET
shift_left_8(unsigned short):
        PUSHM.W #1,R4
        rpt     #8 { rlax.w       R12
        POPM.W  #1,r4
        RET
shift_left_7(unsigned short):
        PUSHM.W #1,R4
        rpt     #7 { rlax.w       R12
        POPM.W  #1,r4
        RET
shift_left_3(unsigned short):
        PUSHM.W #1,R4
        rpt     #3 { rlax.w       R12
        POPM.W  #1,r4
        RET

可以以相同的方式进行右移,但是将add替换为rrc/rrarlax替换为rrax。参见demo on Godbolt

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...