如何在 GCP 中重新训练 AutlML 模型?

问题描述

我在 Google Cloud Vertex AI(Auto ML)上训练并部署了一个自然语言模型,其中包含大约 50,000 条记录数据。 现在我有额外的大约 3,000 条记录数据。 如何使用 3,000 个数据重新训练现有模型? 或者我应该用 53,000 个数据训练一个新模型?

解决方法

我相信在任何训练的机器学习模型中加载新数据是不可能的。不幸的是,如果您想考虑新数据,则需要一起训练。

当您从头开始创建模型时,存在基于您之前的 training the model 的可能性,但在 Cloud Vertex AI 等黑盒应用程序中,客户无法访问模型背后的逻辑。

我推荐这 lecture 条有关在有新数据可用时何时训练模型的提示。

此外,在某些产品(例如 AutoML Vision)中,存在 resumable training 的功能,允许您暂停和恢复大型数据集的模型训练。如果您有兴趣为 Vertex AI 实现此功能,我建议您打开一个 Feature Request