在深度 Q 网络算法中将列表列表作为输入的最佳方法是什么？

我有自己的 DQN 算法环境。在我的环境中，状态空间由列表列表表示，其中每个子列表的长度可以不同。在我的例子中，全局列表的长度是 300，每个子列表的长度从 0 到 10 不等。如果我想使用 PyTorch 平台，使用这种状态表示作为 DQN 输入的最佳方法是什么？

#exapmle state with only 4 sublists
state = [[1,2,3,4],[1,20,20],[10],[20,4,5,6,7]]

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）