解决暴力棋盘游戏的数据库

问题描述

| 几年前,研究人员宣布他们已经完成了针对棋盘游戏的强力综合解决方案。 我对另一个应该具有更少状态的类似游戏感兴趣,但是在任何合理的时间范围内运行完整的求解器仍然不切实际。我仍然想尝试一下,因为即使是部分解决方案也可以提供有价值的信息。 从概念上讲,我想拥有一个游戏状态数据库,该数据库具有每个已知位置及其后续位置。一个或多个客户端可以从数据库获取未探索的状态,计算可能的移动,并将新状态插入数据库中。一旦找到了残局状态,就可以使用minimax信息更新导致该状态的所有状态,以构建决策树。如果做出明智的决定以选择可能的分支进行探索,那么我可以为最重要的分支建立信息,然后逐步建立并逐步完善。 忽略这种想法的优点或可行性,实现这种数据库的最佳方法是什么?我在sql server中制作了一个快速原型,该原型存储了每个状态的字符串表示形式。它起作用了,但是我的求解器客户端运行得非常慢,因为它一次输出一个状态并计算了所有移动。我觉得我需要在内存中做更大的块,但是搜索空间绝对太大,无法一次将其全部存储在内存中。 是否有一个数据库系统更适合这种工作?我将进行许多插入操作,大量读取操作(以检查状态(或等效状态)是否已存在)和很少的更新。 另外,我如何并行化它,以便许多客户可以解决不同的分支而又不会重复太多的工作。我正在考虑一个程序的某种方法,该程序可以检查出一个任务,生成数百万个状态,然后将其提交回以集成到主数据库中。我只是不确定类似的东西是否会很好地工作,或者是否有做这种事情的方法的先前工作。     

解决方法

        为了解决游戏,您真正需要知道的是数据库中每个状态的游戏理论值是多少,即,对于轮到它是移动,是亏损还是被迫的玩家而言,它是否是赢家?画。您需要两个位来对每个状态的此信息进行编码。 然后,您会针对要为其构建最终游戏数据库的那组游戏状态找到尽可能紧凑的编码。假设您的编码需要20位。这样就足以在硬盘上具有221位的数组,即213个字节。在分析最终游戏位置时,首先要检查数据库中是否已经设置了相应的值;如果不是,则计算其所有继任者,递归计算其博弈论值,然后使用最小值/最大值计算原始节点的博弈论值并存储在数据库中。 (注意:如果您将胜利/失败/平局数据存储在两位中,则剩下的一位模式表示“未知”;例如00 =未知,11 =抽签,10 =获胜者移动胜利,01 =玩家移动失败)。 例如,考虑井字游戏。有九个正方形;每个字符都可以为空,\“ X \”或\“ O \”。这种幼稚的分析为您提供39 = 214.26 = 15位的每个状态,因此您将拥有216位的数组。     ,        毫无疑问,您需要某种任务队列服务,例如RabbitMQ-可能与数据库结合使用,一旦计算出数据便可以存储数据。或者,您可以使用托管服务,例如Amazon的SQS。客户将使用队列中的项目,生成后继者,并将其排队,并将刚刚消耗的项目结果添加到队列中。如果状态是结束状态,则可以通过查询数据库将评分信息传播到父元素。 请注意两个注意事项: 当您浏览树时,队列中的项目数可能会成倍增长,每个工作项都会导致另外几个入队。准备好排很长的队伍。 根据您的游戏,可能有通向同一游戏状态的多个路径。您需要检查并消除重复项,并且需要对数据库进行结构化,使其成为图形(可能带有循环!),而不是树。     ,我想到的第一件事是共享“白板”的Linda风格,其中不同的流程可以消耗白板上的“问题”,在白板上添加新问题,并添加“解决方案”到白板上。 也许Cassandra项目是Linda的更新版本。 已经进行了许多尝试来使分布式计算机系统中的问题并行化。 Folding @ Home提供了一个执行二进制blob'cores'的框架来解决蛋白质折叠问题。 Distributed.net可能已经开始了分布式问题解决的现代化形式,并且可能拥有可以作为起点的客户。