在深度 Q 网络算法中将列表列表作为输入的最佳方法是什么?

问题描述

我有自己的 DQN 算法环境。在我的环境中,状态空间由列表列表表示,其中每个子列表的长度可以不同。在我的例子中,全局列表的长度是 300,每个子列表的长度从 0 到 10 不等。如果我想使用 PyTorch 平台,使用这种状态表示作为 DQN 输入的最佳方法是什么?

#exapmle state with only 4 sublists
state = [[1,2,3,4],[1,20,20],[10],[20,4,5,6,7]]

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)