平均学习曲线与置信区间的重复 [Ray Tune,Tensorboard]

问题描述

对于强化学习实验,我经常对每个超参数设置进行独立的重复。理想情况下,我会可视化这些重复(每个设置)的平均值,包括平均学习曲线周围的置信区间。我想很多 RL 研究人员都有这个问题。

我使用 Ray Tune 运行我的超参数实验,它会自动将 Tensorboard 中的每个独立运行可视化(这非常有用)。如果我可以自动聚合重复的结果(自信地),然后比较不同的超参数设置(并为论文绘制它们),那将非常有帮助。我在 Tune/Tensorboard 中找不到任何方法来做到这一点,也找不到与另一个可以做到这一点的框架的集成。

例如,我理想情况下会得到如下曲线,然后直接在 Tensorboard 中

Text

我想更多的人会遇到这个问题,并且很好奇是否有人知道从 Ray Tune 输出到上图的软件包或快速解决方案(无需手动编码)。 非常感谢!

最好的问候, 托马斯

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)