使用 Soft-Actor Critic (SAC)

问题描述

我目前正在训练使用来自 StableBaselines3 的 SAC 的自定义环境。我正在使用 MlpPolicy,据我所知,认情况下它是一个 2 层 256 神经元神经网络。我对评估不同神经架构的训练性能很感兴趣,但在我对如何更改神经架构进行了大量谷歌搜索后,我能想到的最好的结果显示在下面的代码片段中。

policy_kwargs = dict(net_arch=[128,128,128])
model = SAC(MlpPolicy,env1,policy_kwargs=policy_kwargs,verbose=1)

问题是我不知道如何查看已经训练好的模型的神经架构,以查看神经网络是否真的发生了变化。有没有办法可以从训练后创建的 model.zip 文件中找到使用的神经架构?在最近的一次讨论中,有人告诉我,有一种方法可以查看训练期间使用的神经元百分比,以评估模型是否需要更多训练,并决定增加/减少神经层或神经元是否有益,但我没有'无法找到有关如何在代码中实现它的任何资源。

我是 RL 培训的新手,不胜感激任何用于完成上述任务的资源或代码示例。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)