问题描述
我以前看过这类问题,但提供的答案并不能让我明白一切。发布此问题时,通常会附上下一个示例:
#include <iostream>
int main()
{
unsigned int u = 10;
int i = -42;
std::cout << i + i << std::endl;
std::cout << i + u << std::endl;
return 0;
}
输出:
-84
4294967264
一切都按预期工作 int 转换为无符号。但如果 i
的绝对值小于 u
,则似乎没有发生此类转换。
#include <iostream>
int main()
{
unsigned int u = 10;
int i = -3;
std::cout << i + i << std::endl;
std::cout << i + u << std::endl;
return 0;
}
输出:
-6
7
我没有看到任何提到它的答案,也找不到任何解释。尽管这似乎是合乎逻辑的事情发生,但我对此没有任何解释。
解决方法
之后:
unsigned int u = 10;
int i = -3;
i + u
的计算首先将 i
转换为 unsigned int
。对于 32 位 unsigned int
,此转换包含模 232,即 4,294,967,296。这种包装的结果是 -3 + 4,296 = 4,293。
转换后,我们将添加 4,293(转换后的 i
)和 10 (u
)。这将是 4,303。由于这超出了 32 位 unsigned int
的范围,因此将其以 4,296 为模进行包装。其结果是 4,303 − 4,296 = 7。
因此打印了“7”。
,但如果 i 的绝对值小于 u,则似乎没有发生这种转换。
您的假设是错误的:这种转换正在发生。 “这种转换”是指当 -3 转换为无符号类型时,结果为 4'294'967'293。
我没有看到任何提到它的答案,也找不到任何解释。
无符号算术是模块化的。这就是模算术的工作原理。
要理解模算术,请考虑 12 小时制的工作原理。它也是模块化的。您会注意到钟面没有任何负数:
- 时间是 10 点(今天上午)。 3 小时前,现在几点了?现在是 7 点(今天上午)。
- 时间是 10 点(今天上午)。 42 小时前,现在几点了?现在是 4 点(前天下午)
无符号算术就是这样工作的。除了 32 位类型的情况下,不是 12 个值,而是 4'294'967'296 个值。
为了将不可表示的值转换为可表示的范围,只需添加或减去模数(时钟情况下为 12,32 位无符号整数情况下为 4'294'967'296),直到该值处于可表示范围内范围。
以下是时钟示例的数学计算:
R ≡ 10 + (-3) (mod 12)
// -3 = 9 + (12 * -1)
R ≡ 10 + 9 (mod 12)
R ≡ 19 (mod 12)
// 19 = 7 + (12 * 1)
R ≡ 7 (mod 12)
R ≡ 10 + (-42) (mod 12)
// -42 = 6 + (12 * -4)
R ≡ 10 + 6 (mod 12)
R ≡ 16 (mod 12)
// 16 = 4 + (12 * 1)
R ≡ 4 (mod 12)
以下是示例的数学计算:
R ≡ 10 + (-42) (mod 4'294'967'296)
// -42 = 4'294'967'254 + (4'294'967'296 * -1)
R ≡ 10 + 4'294'967'254 (mod 4'294'967'296)
R ≡ 4'294'967'264 (mod 4'294'967'296)
R ≡ 10 + (-3) (mod 4'294'967'296)
// -3 = 4'294'967'293 + (4'294'967'296 * -1)
R ≡ 10 + 4'294'967'293 (mod 4'294'967'296)
R ≡ 4'294'967'303 (mod 4'294'967'296)
// 4'294'967'303 = 7 + (4'294'967'296 * -1)
R ≡ 7 (mod 4'294'967'296)
,
有两个概念对于理解负数和无符号数之间的关系非常重要。第一个是Ones compliment。这是一个非常古老的标准,不再使用,但很容易理解。负数只是每个位的非。 -1 = ~1 = 1111...1110。 补码的问题是有两个零 (+0/-0)。这很快就会变得复杂。考虑
X = 2-2
Y = -2+2
X != Y
这就是现代计算机和 C/C++ 采用 twos compliment 的原因。二元赞美下降-0(没有这样的事情)等等
-1 = 1111...1111
-2 = 1111...1110
so -v = ~1+1
您会看到没有“操作”可以在有符号和无符号之间进行转换。在硬件中,每个都只是一个位向量。值是有符号还是无符号,只是如何解释位的问题。为了证明这一点,您只需尝试
printf("%x",-1); // print a signed value as if it was unsigned
所以回到你的问题,任何小的 (+v) 数字都是相同的,无论是否有符号。 (signed) 1 与无符号 (1) 相同。只有当最高有效位为 1 时,解释才会改变。
顺便说一句:在 C/C++ 中,“unsigned int”可以缩写为“unsigned”,这是规则的残余,即任何未指定的类型都被假定为 int。