平均学习曲线与置信区间的重复 [Ray Tune，Tensorboard]

问题描述

对于强化学习实验，我经常对每个超参数设置进行独立的重复。理想情况下，我会可视化这些重复（每个设置）的平均值，包括平均学习曲线周围的置信区间。我想很多 RL 研究人员都有这个问题。

我使用 Ray Tune 运行我的超参数实验，它会自动将 Tensorboard 中的每个独立运行可视化（这非常有用）。如果我可以自动聚合重复的结果（自信地），然后比较不同的超参数设置（并为论文绘制它们），那将非常有帮助。我在 Tune/Tensorboard 中找不到任何方法来做到这一点，也找不到与另一个可以做到这一点的框架的集成。

例如，我理想情况下会得到如下曲线，然后直接在 Tensorboard 中

Text

我想更多的人会遇到这个问题，并且很好奇是否有人知道从 Ray Tune 输出到上图的软件包或快速解决方案（无需手动编码）。非常感谢！

最好的问候，托马斯

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

curve moving-average ray tensorboard