$\pi$

问题描述

当使用蒙特卡罗方法估计$\pi$时,我们会将一个单位圆拟合成一个正方形,例如:

enter image description here

我对上面圆圈的以下描述很困惑,它是从https://www.geeksforgeeks.org/estimating-value-pi-using-monte-carlo/提取的:

enter image description here

正方形的面积不应该是 $2^2$,因为 0 到 -1 是 1 而 0 到 1 是另一个 1? 圆的半径也是如此 - 不是 $1$ 而不是 $\frac{1}{2}$?

解决方法

似乎是作者的错误。我猜他们仓促地将图像解释为左下角为 (0,0) 而不是 (-1,-1) 的图。另一种可能是图片改变了,描述没有改变。

但正如罗伯特指出的那样,你是对的,但请记住,他们对正方形面积的计算也是错误的。

,

客观来说你是对的。圆的半径长度为 1,正方形的每条边的长度为 2。我认为图像没有正确缩放。这个故事的寓意是在区域之间建立这种关系:

Area_of_circle/Area_of_square = pi/4

此外,我还建议您查看 Rich Sutton 的《强化学习》书中关于政策的蒙特卡罗控制:

enter image description here

这很好地概括了使用 epsilon 软策略来选择贪婪动作来估计最优策略的算法。