使用神经网络更新 R 中的 DQN

问题描述

我正在尝试使用 neuralnet 包在 R 中实现一个简单的深度 Q 学习案例。

我有一个带有初始随机权重的初始网络。我用它来为我的代理产生一些经验,因此,我得到了状态和目标。然后我将状态拟合到目标并获得一个具有新权重的新网络。

如何将新权重和初始权重结合起来?我是否只需保留新权重并丢弃初始权重?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)