GCP:IA ML 服务,自动缩放为零

问题描述

我想尝试 GCP 的 ML 服务 AI 平台,但我希望节点仅在调用预测时扩展。

我在 documentation here 中看到:

如果您选择“自动缩放”,则会显示可选的最小节点数字段。您可以输入在服务缩减时始终保持运行的最小节点数。此字段认为 0。

但是当我尝试创建我的模型版本时,它显示一个错误,告诉我这个字段应该 > 1。

这是我尝试过的:

  • 名称:testv1
  • 预建容器
  • Python 3.7
  • 框架张量流
  • TF 2.4.0 版
  • ML 2.4
  • 缩放自动缩放
  • 最小节点 nb 0
  • 机器类型 n1-standard-4
  • GPU TESLA_K80 * 1

解决方法

我尝试重现您的案例并发现同样的问题,我无法将 Minimum number of nodes 设置为 0。

这似乎是一个过时的文档问题。正在进行的 Feature Request 解释了可以使用旧机器类型设置最少 0 台机器,并请求使此选项也可用于当前类型。

另一方面,我继续开了一张票来更新文档。

作为一种解决方法,您可以在需要时立即部署模型,然后继续 un-deploy 它们。请注意,取消部署最多可能需要 45 分钟,因此建议等待 1 小时重新部署该模型,以避免出现任何问题。