用于服务模型预测的 Google Kubernetes Engine 与 Vertex AIAI Platform Unified

问题描述

随着 Google 最近发布了集成其所有 MLOps 平台的 Vertex AI,我想知道在 GKE 与 Vertex AI(或 AI Platform Unified,因为更名只是发生了,并且 AI Platform 已经提供了提供模型预测服务的能力)。

我做了很多研究,但发现的信息很少。我已经在 GKE 上托管了我的 ML 模型,是否值得迁移到 Vertex AI?

注意:我不打算在云上进行训练和其他数据预处理。

解决方法

值得将 Vertex AI 视为:

Vertex AI 是一个“托管”机器学习平台,供从业者加速实验和部署 AI 模型。在部署/训练/预测 ML 模型时,我们不需要管理基础设施/服务器/健康状况。 Vertex AI 会为您处理这些问题,并根据流量进行缩放。

有助于考虑 Vertex AI 的一些关键特性:

  1. Vertex AI streamlines model development

一旦模型经过训练,我们就会获得详细的模型评估指标和特征属性。 (特征归因表明模型中的哪些特征最能表明模型的预测,从而深入了解模型在幕后的表现)

  1. Scalable deployment with endpoints

一旦模型经过训练,就可以将其部署到端点。模型间流量可分流测试,机器类型可定制

  1. Orchestrating Workflow using Vertex pipeline

顶点管道有助于避免模型漂移的概念,当模型周围的环境发生变化时可能会发生这种情况。 Vertex 管道可以帮助自动执行此保留工作流程。

  1. Monitoring deployed models using Vertex AI

顶点模型监控可用于检测诸如漂移和训练服务偏差之类的事情,因此与其手动检查以确保模型仍然正确执行,不如使用顶点 AI 提供对模型可靠性的信心,因为我们会收到警报随时发生变化。