tensorflow-agents

tensorflow-agents

合并和拆分来自 TF-agents 的时间和动作步骤

我正在尝试在一个简单的多智能体非合作并行游戏中使...

TF-Agents 自定义环境应急行动

对仅在某些状态下允许的操作进行编码的惯用方法是什...

在 TensorFlow 中根据状态限制 RL 动作空间

我通过 TF Agents 包感受到了软弱的演员评论家。我遇...

Tf-agents 环境示例中 _observation_spec 的形状和 _action_spec 的形状

在 <a href="https://colab.research.google...

绘制多臂强盗的奖励值

如何在具有 Per-Arm 特征的 Multi-Arm Bandits 上绘...

为什么当我将 Cartpole 环境换成我自己的更简单的环境时，TensorFlow Agents 的内置 DQN 教程无法学习？

我正在尝试训练一个 DQN 代理，该代理几乎完全按照 ...

有银行的多臂强盗的 tensorflow 例子吗？

我一直在研究一些 Tensorflow 代理 <a href="...

actor_network 输出规范与动作规范不匹配：TensorSpec(...) 与 BoundedTensorSpec(...)

我正在尝试创建一个actor Policy，它是一个使用tf_a...

使用 tf_agents.environments.TFPyEnvironment 将 Python RL 环境转换为 TF 环境时会发生哪些变化？

在使用 tf_agents.environments.TFPyEnvironment 将...

为什么我观察到的张量形状从 time_step_spec() 的返回变为 step(action) 的返回？

我正在尝试从 Python 环境开始模拟 RL 环境，然后通...

如何在 step 方法中为 TF-Agents 环境提供一组动作？

我想对我的环境进行建模，使每个操作由 3 个可能的子...

Google Colab 中的错误：SystemError：此解释器版本：“3.7.10”与 ViZDoom 编译器的版本不匹配：3.7.11

我正在使用 Google Colab 结合 TensorFlow（特别是 ...

上一页下一页