问题描述
我使用 CoLab Pro 有几天了。我试图在 CoLab Pro 中使用 TPU 运行时训练深度学习模型。但是,经过 12 小时的培训后,Runtime 会自动断开连接。我为训练配置了 70 个 epoch,它在 43 - 52 个 epoch 左右停止。我使用 Keras/Tensorflow 来开发我的模型。在过去的三天里,我正在训练同一个模型,但我无法完成训练过程。令人沮丧的是,即使选择了 CoLab Pro,我们也无法完全训练模型。
解决方法
当我尝试使用 Google Chrome 时,我能够在 Colab Pro 中进行大约 11 小时的培训。所以我认为在谷歌浏览器中,即使在 12 小时后也可能不会自动断开连接。如果我们使用 Mozilla,则会发生自动断开连接。我已经在 Mozilla 中进行了多次测试,但在 8 或 12 小时后断开连接。