问题描述
在 GCP AI Platform Unified 的文档中它说:
即使您已将预测节点配置为使用 GPU,AI Platform 也会根据 cpu 使用情况扩展您的节点;因此,如果您的预测吞吐量导致高 GPU 使用率,而不是高 cpu 使用率,您的节点可能无法按预期扩展
我们如何根据 GPU 使用情况进行扩展?
解决方法
- 旧版 AI Platform 似乎能够做到这一点 [1],但它也处于预览阶段,而且此功能似乎尚未添加到 AI Platform Unified。
- 您可以查看 AI Platform Unified 发行说明更新 [2] 以查看有关此功能的更新
[1]https://cloud.google.com/ai-platform/prediction/docs/machine-types-online-prediction#specifying_gpus
[2]https://cloud.google.com/ai-platform-unified/docs/resources/release-notes