GCP AI Platform Unified - AutoScaling

问题描述

GCP AI Platform Unified 的文档中它说:

即使您已将预测节点配置为使用 GPU,AI Platform 也会根据 cpu 使用情况扩展您的节点;因此,如果您的预测吞吐量导致高 GPU 使用率,而不是高 cpu 使用率,您的节点可能无法按预期扩展

我们如何根据 GPU 使用情况进行扩展?

解决方法

  1. 旧版 AI Platform 似乎能够做到这一点 [1],但它也处于预览阶段,而且此功能似乎尚未添加到 AI Platform Unified。
  2. 您可以查看 AI Platform Unified 发行说明更新 [2] 以查看有关此功能的更新

[1]https://cloud.google.com/ai-platform/prediction/docs/machine-types-online-prediction#specifying_gpus

[2]https://cloud.google.com/ai-platform-unified/docs/resources/release-notes