C++ 无符号和有符号转换

问题描述

我以前看过这类问题，但提供的答案并不能让我明白一切。发布此问题时，通常会附上下一个示例：

#include <iostream>

int main()
{
    unsigned int u = 10;
             int i = -42;

    std::cout << i + i << std::endl;
    std::cout << i + u << std::endl;

    return 0;
}

输出：

-84
4294967264

一切都按预期工作 int 转换为无符号。但如果 i 的绝对值小于 u，则似乎没有发生此类转换。

#include <iostream>

int main()
{
    unsigned int u = 10;
             int i = -3;

    std::cout << i + i << std::endl;
    std::cout << i + u << std::endl;

    return 0;
}

输出：

-6
7

我没有看到任何提到它的答案，也找不到任何解释。尽管这似乎是合乎逻辑的事情发生，但我对此没有任何解释。

解决方法

之后：

unsigned int u = 10;
         int i = -3;

i + u 的计算首先将 i 转换为 unsigned int。对于 32 位 unsigned int，此转换包含模 2³²，即 4,294,967,296。这种包装的结果是 -3 + 4,296 = 4,293。

转换后，我们将添加 4,293（转换后的 i）和 10 (u)。这将是 4,303。由于这超出了 32 位 unsigned int 的范围，因此将其以 4,296 为模进行包装。其结果是 4,303 − 4,296 = 7。

因此打印了“7”。

但如果 i 的绝对值小于 u，则似乎没有发生这种转换。

您的假设是错误的：这种转换正在发生。 “这种转换”是指当 -3 转换为无符号类型时，结果为 4'294'967'293。

我没有看到任何提到它的答案，也找不到任何解释。

无符号算术是模块化的。这就是模算术的工作原理。

要理解模算术，请考虑 12 小时制的工作原理。它也是模块化的。您会注意到钟面没有任何负数：

时间是 10 点（今天上午）。 3 小时前，现在几点了？现在是 7 点（今天上午）。
时间是 10 点（今天上午）。 42 小时前，现在几点了？现在是 4 点（前天下午）

无符号算术就是这样工作的。除了 32 位类型的情况下，不是 12 个值，而是 4'294'967'296 个值。

为了将不可表示的值转换为可表示的范围，只需添加或减去模数（时钟情况下为 12，32 位无符号整数情况下为 4'294'967'296），直到该值处于可表示范围内范围。

以下是时钟示例的数学计算：

R ≡ 10 + (-3)          (mod 12)
// -3 = 9  + (12 * -1)
R ≡ 10 + 9             (mod 12) 
R ≡ 19                 (mod 12)
// 19 = 7  + (12 *  1)
R ≡ 7                  (mod 12)

R ≡ 10 + (-42)         (mod 12)
// -42 = 6 + (12 * -4)
R ≡ 10 + 6             (mod 12)
R ≡ 16                 (mod 12)
// 16 = 4 +  (12 *  1)
R ≡ 4                  (mod 12)

以下是示例的数学计算：

R ≡ 10 + (-42)         (mod 4'294'967'296)
// -42           = 4'294'967'254 + (4'294'967'296 * -1)
R ≡ 10 + 4'294'967'254 (mod 4'294'967'296)
R ≡ 4'294'967'264      (mod 4'294'967'296)

R ≡ 10 + (-3)          (mod 4'294'967'296)
// -3            = 4'294'967'293 + (4'294'967'296 * -1)
R ≡ 10 + 4'294'967'293 (mod 4'294'967'296)
R ≡ 4'294'967'303      (mod 4'294'967'296)
// 4'294'967'303 = 7             + (4'294'967'296 * -1)
R ≡ 7                  (mod 4'294'967'296)

有两个概念对于理解负数和无符号数之间的关系非常重要。第一个是Ones compliment。这是一个非常古老的标准，不再使用，但很容易理解。负数只是每个位的非。 -1 = ~1 = 1111...1110。补码的问题是有两个零 (+0/-0)。这很快就会变得复杂。考虑

X = 2-2  
Y = -2+2  
X != Y

这就是现代计算机和 C/C++ 采用 twos compliment 的原因。二元赞美下降-0（没有这样的事情）等等

-1 = 1111...1111  
-2 = 1111...1110  
so -v = ~1+1

您会看到没有“操作”可以在有符号和无符号之间进行转换。在硬件中，每个都只是一个位向量。值是有符号还是无符号，只是如何解释位的问题。为了证明这一点，您只需尝试

printf("%x",-1); // print a signed value as if it was unsigned

所以回到你的问题，任何小的 (+v) 数字都是相同的，无论是否有符号。 (signed) 1 与无符号 (1) 相同。只有当最高有效位为 1 时，解释才会改变。

顺便说一句：在 C/C++ 中，“unsigned int”可以缩写为“unsigned”，这是规则的残余，即任何未指定的类型都被假定为 int。

c++unsigned-integer