问题描述
我正在实现一种简单的算法来估计c中的double的sqrt,类似于我在Java中学习的方法。
但是,当我使用printf(“当前猜测:%.30f \ n”,猜测);打印我目前的猜测,我实际上得到了30位数的双精度数字。我的印象是,由于IEEE,双精度只能有15个十进制数字?这些数字从哪里来?
我的完整代码:
int main() {
// Finding the sqrt of x
double x = 1337.;
double high = x;
double low = 0.;
double guess;
double lastguess = -1.;
for(int i=0; i<1000; i++) {
lastguess = guess;
guess = low+(high-low)/2;
if(compDouble(guess,lastguess)) {
break;
}
if(guess*guess > x) {
// Guess was too high
// get the lower interval
low = low;
high = guess;
} else {
// Guess was too low,get the upper interval
low = guess;
high = high;
}
printf("Current guess: %.30f \n",guess);
}
printf("sqrt of %f is about %f",x,guess);
return 1;
}
输出:
Current guess: 668.500000000000000000000000000000
Current guess: 334.250000000000000000000000000000
Current guess: 167.125000000000000000000000000000
Current guess: 83.562500000000000000000000000000
Current guess: 41.781250000000000000000000000000
Current guess: 20.890625000000000000000000000000
Current guess: 31.335937500000000000000000000000
Current guess: 36.558593750000000000000000000000
Current guess: 39.169921875000000000000000000000
Current guess: 37.864257812500000000000000000000
Current guess: 37.211425781250000000000000000000
Current guess: 36.885009765625000000000000000000
Current guess: 36.721801757812500000000000000000
Current guess: 36.640197753906250000000000000000
Current guess: 36.599395751953125000000000000000
Current guess: 36.578994750976562500000000000000
Current guess: 36.568794250488281250000000000000
Current guess: 36.563694000244140625000000000000
Current guess: 36.566244125366210937500000000000
Current guess: 36.564969062805175781250000000000
Current guess: 36.565606594085693359375000000000
Current guess: 36.565287828445434570312500000000
Current guess: 36.565128445625305175781250000000
Current guess: 36.565048754215240478515625000000
Current guess: 36.565008908510208129882812500000
Current guess: 36.565028831362724304199218750000
Current guess: 36.565018869936466217041015625000
Current guess: 36.565013889223337173461914062500
Current guess: 36.565011398866772651672363281250
Current guess: 36.565010153688490390777587890625
Current guess: 36.565010776277631521224975585938
Current guess: 36.565010464983060956001281738281
Current guess: 36.565010620630346238613128662109
Current guess: 36.565010542806703597307205200195
Current guess: 36.565010581718524917960166931152
Current guess: 36.565010601174435578286647796631
Current guess: 36.565010591446480248123407363892
Current guess: 36.565010596310457913205027580261
Current guess: 36.565010598742446745745837688446
Current guess: 36.565010597526452329475432634354
Current guess: 36.565010598134449537610635161400
Current guess: 36.565010597830450933543033897877
Current guess: 36.565010597678451631509233266115
Current guess: 36.565010597602451980492332950234
Current guess: 36.565010597564452154983882792294
sqrt of 1337.000000 is about 36.565011
解决方法
我的印象是,由于IEEE,双精度只能有15个十进制数字?
嗯,那是错误的。
尝试一下:
double d = 1.0e-45;
printf("d is %.60f \n",d);
输出:
d is 0.000000000000000000000000000000000000000000001000000000000000
如您所见,十进制数字多于15个。
小数位数取决于数字的值。很小的数字可以有很多十进制数字(首先是很多零),而很大的数字根本不能有任何十进制数字。一些非常大的数字甚至不能表示奇数。
标准64位双精度数可以具有的最小非零(正)值是2 -1074 ,即:
0.000......04940656.............47265625
^ ^
| |
Decimal digit #324 Decimal digit #1074
使用以下代码尝试:
int main(void)
{
assert(sizeof(double) == sizeof(uint64_t));
union
{
uint64_t i;
double d;
} x;
x.i = 1; // The smallest non-zero positive double value
printf("%.1100f \n",x.d);
return 0;
}
,
我的印象是,由于IEEE,双精度只能有15个十进制数字?
这是不正确的。当double
使用IEEE-754 binary64格式时,数字用有效位数(浮点数的“分数”部分)的53个二进制数字(位)表示,并带有符号和幂的两个(指数)。每个binary64数字精确地表示一个特定数字,并且它们相对于十进制数字不是均匀分布。
举一个简单的例子,考虑有效数字为1但指数变化的数字。例如,考虑+ 1•2 0 (符号+,有效数1,指数0)。用十进制表示的是“ 1”,只有一位数字。那么+ 1•2 −1 为“ .5”,仍仅为一位有效数字。 + 1•2 −2 为“ .25”。尽管它的有效位数只是一个,但它有两个有效数字。紧随其后的是“ .125”,“。0625”,“ 0.03125”,依此类推。如您所见,即使有效位数仍然为1,十进制数字所需的有效数字位数也会增加。
因此,表示一个binary64数字所需的小数位数取决于有效位数和指数。
我们可以计算36左右的数字可能需要多少个十进制数字。因为10具有2的一个因数,所以Binary64的指数每次减小(减小为更大的负值)可能需要再加上一个小数位来表示:在0.5中,最后一位在10 -1 位置。在.25中,它处于10 −2 位置,在.125中,它处于10 -3 位置,依此类推。
要表示36附近的数字,binary64必须使用5的指数,以便有效数的最高位(通常规范化为1到2之间,包括1但不包括2)被缩放为32。然后,在小数位数中,有效位数表示2 5 ,2 4 ,2 3 ,…2 5- 52 。最低有效位2 5-52 是2 −47 。
因此,当以十进制表示时,大约在36处的一些binary64数字将在小数点的左边有两位,在小数点的右边是47,因此它们将有49位有效的十进制数字。
binary64格式允许指数减小到−1022,这时有效位数的最低有效位被缩放为−1022−52 = −1074,因此以十进制表示最小的正Binary64值需要小数点后的1074位数字
,IEEE DOUBLE大约有16个有效数字。也就是说,如果您查看代表DOUBLE的十进制数字字符串,则大约前16位之后的任何数字都将是“垃圾”。 (我忽略了前导零。)
因此,可以肯定,您可以显示 30位数字。但是只有前半部分可以信任。
继续研究平方根;有一个简单的算法可以平方收敛;你的似乎是线性的。