带有 Keras 的 Python 神经网络在 CPU 上运行,但在 GPU 上崩溃

问题描述

我实现了一个神经网络,该网络使用带有 Keras 模型的gym、Box2d 和gym[atari] 来学习玩吃豆人。训练非常缓慢,所以我尝试在我的 GTX 1060 Max-Q 上进行。 我安装了最新版本的 Tensorflow,安装了 CUDA 11.0 和 cuDNN 8.0.4.30。程序成功打开所有库,正确检测 GPU,创建 Tensor 设备,开始渲染的第一帧,冻结约 9 秒,然后退出代码 -1073740791 (0xC0000409)

为什么会发生这种情况,我该如何解决

解决方法

-1073740791 (0xC0000409) 是 windows 机器上的堆栈缓冲区溢出

Here 的一些文档。

您需要将训练文件缩小或在更好的 PC 上运行