如何使用自定义 TF 回调打印出经过测试的 openai 健身房环境的状态?

问题描述

这是我的功能

scores = dqn.test(env,nb_episodes=1,visualize=False,verbose=1,callbacks=[CustomCallback()])

我从 https://www.tensorflow.org/guide/keras/custom_callback 复制粘贴了自定义回调类

我有一个标准的 openai 健身房环境用于训练我的 DQN:

class TestEnv(Env):

def __init__(self):
    ...
def step(self,action):
    ...     
    return sum(self.state.values()),reward,done,info

def render(self):
    pass

def reset(self):
    ...       
    return sum(self.state.values())

如果可能的话,我想从回调类中绘制 sum(self.state.values()) 的值。我想了解如何将这些值传递给方法中的回调类:

class CustomCallback(keras.callbacks.Callback):
   ...

def on_epoch_end(self,epoch,logs=None):
    keys = list(logs.keys())
    print("End epoch {} of training; got log keys: {}".format(epoch,keys))
    print( **sum(self.state.values())**)

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)