C++ 无符号和有符号转换

问题描述

我以前看过这类问题,但提供的答案并不能让我明白一切。发布此问题时,通常会附上下一个示例:

#include <iostream>

int main()
{
    unsigned int u = 10;
             int i = -42;

    std::cout << i + i << std::endl;
    std::cout << i + u << std::endl;

    return 0;
}

输出

-84
4294967264

一切都按预期工作 int 转换为无符号。但如果 i 的绝对值小于 u,则似乎没有发生此类转换。

#include <iostream>

int main()
{
    unsigned int u = 10;
             int i = -3;

    std::cout << i + i << std::endl;
    std::cout << i + u << std::endl;

    return 0;
}

输出

-6
7

我没有看到任何提到它的答案,也找不到任何解释。尽管这似乎是合乎逻辑的事情发生,但我对此没有任何解释。

解决方法

之后:

unsigned int u = 10;
         int i = -3;

i + u 的计算首先将 i 转换为 unsigned int。对于 32 位 unsigned int,此转换包含模 232,即 4,294,967,296。这种包装的结果是 -3 + 4,296 = 4,293。

转换后,我们将添加 4,293(转换后的 i)和 10 (u)。这将是 4,303。由于这超出了 32 位 unsigned int 的范围,因此将其以 4,296 为模进行包装。其结果是 4,303 − 4,296 = 7。

因此打印了“7”。

,

但如果 i 的绝对值小于 u,则似乎没有发生这种转换。

您的假设是错误的:这种转换正在发生。 “这种转换”是指当 -3 转换为无符号类型时,结果为 4'294'967'293。

我没有看到任何提到它的答案,也找不到任何解释。

无符号算术是模块化的。这就是模算术的工作原理。

要理解模算术,请考虑 12 小时制的工作原理。它也是模块化的。您会注意到钟面没有任何负数:

  • 时间是 10 点(今天上午)。 3 小时前,现在几点了?现在是 7 点(今天上午)。
  • 时间是 10 点(今天上午)。 42 小时前,现在几点了?现在是 4 点(前天下午)

无符号算术就是这样工作的。除了 32 位类型的情况下,不是 12 个值,而是 4'294'967'296 个值。


为了将不可表示的值转换为可表示的范围,只需添加或减去模数(时钟情况下为 12,32 位无符号整数情况下为 4'294'967'296),直到该值处于可表示范围内范围。

以下是时钟示例的数学计算:

R ≡ 10 + (-3)          (mod 12)
// -3 = 9  + (12 * -1)
R ≡ 10 + 9             (mod 12) 
R ≡ 19                 (mod 12)
// 19 = 7  + (12 *  1)
R ≡ 7                  (mod 12)

R ≡ 10 + (-42)         (mod 12)
// -42 = 6 + (12 * -4)
R ≡ 10 + 6             (mod 12)
R ≡ 16                 (mod 12)
// 16 = 4 +  (12 *  1)
R ≡ 4                  (mod 12)

以下是示例的数学计算:

R ≡ 10 + (-42)         (mod 4'294'967'296)
// -42           = 4'294'967'254 + (4'294'967'296 * -1)
R ≡ 10 + 4'294'967'254 (mod 4'294'967'296)
R ≡ 4'294'967'264      (mod 4'294'967'296)

R ≡ 10 + (-3)          (mod 4'294'967'296)
// -3            = 4'294'967'293 + (4'294'967'296 * -1)
R ≡ 10 + 4'294'967'293 (mod 4'294'967'296)
R ≡ 4'294'967'303      (mod 4'294'967'296)
// 4'294'967'303 = 7             + (4'294'967'296 * -1)
R ≡ 7                  (mod 4'294'967'296)
,

有两个概念对于理解负数和无符号数之间的关系非常重要。第一个是Ones compliment。这是一个非常古老的标准,不再使用,但很容易理解。负数只是每个位的非。 -1 = ~1 = 1111...1110。 补码的问题是有两个零 (+0/-0)。这很快就会变得复杂。考虑

X = 2-2  
Y = -2+2  
X != Y

这就是现代计算机和 C/C++ 采用 twos compliment 的原因。二元赞美下降-0(没有这样的事情)等等

-1 = 1111...1111  
-2 = 1111...1110  
so -v = ~1+1

您会看到没有“操作”可以在有符号和无符号之间进行转换。在硬件中,每个都只是一个位向量。值是有符号还是无符号,只是如何解释位的问题。为了证明这一点,您只需尝试

printf("%x",-1); // print a signed value as if it was unsigned

所以回到你的问题,任何小的 (+v) 数字都是相同的,无论是否有符号。 (signed) 1 与无符号 (1) 相同。只有当最高有效位为 1 时,解释才会改变。

顺便说一句:在 C/C++ 中,“unsigned int”可以缩写为“unsigned”,这是规则的残余,即任何未指定的类型都被假定为 int。