使用大众为奖励分配添加噪音

问题描述

我想在我拥有的奖励分配中添加噪音。 应该以什么格式表示奖励分配,以便大众理解和 大众汽车有哪些方法可以引起噪音? 例如,您可以考虑给定 here

解决方法

奖励函数对于一个好的强化学习算法来说是必不可少的。在您的模拟中,奖励函数有助于奖励分布,因此向奖励分布添加噪声的一种方法可能是(考虑本教程)修改您的成本函数以提供随机结果。因此,您可以通过这种方式为分布添加噪声。