蒙特卡洛树搜索中的推出/播出如何工作?

问题描述

我正在为 Java 中名为 Fox and Sheep board game 的游戏创建 AI 代理。

Fox and sheep board game

代理基于蒙特卡洛树搜索算法。 Rollout 就是选择一个随机的游戏状态,直到我们到达一个终端状态。我想知道:如果 AI 代理在推出时失败了怎么办?我应该返回 0 还是 -1? 我知道推出应该代表模拟移动是否获胜。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)