问题描述
在TF Agents的github仓库中,存在三个驱动程序类,用于使用tensorflow策略逐步进入tensorflow环境。前两个是dynamic_step_driver
和dynamic_episode_driver
,它们分别通过规定数量的状态和情节推进环境。第三个是tf_driver
,它与py_driver
类似,因为它可以指定步数和情节数。我的问题是:假设tf_driver
在其循环上使用tf.function
,是否可以使用tf_driver
而不是其他两个TFEnvironment驱动程序来获得相同的结果,或者存在性能差异?>
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)