创建版本失败检测到错误模型并显示错误:“加载模型时出错” - AI Platform Prediction

问题描述

我通过使用全局端点的 AI Platform UI 创建了一个模型。我正在尝试部署使用“保存的模型”构建器导出的基本 tensorflow 1.15.0 模型。当我尝试部署此模型时,我在 UI 中收到 Create Version Failed. Bad model detected with error: "Error loading the model" 错误,并且我在日志中看到以下内容

ERROR:root:Failed to import GA GRPC module. This is OK if the runtime version is 1.x

Failure: Could not reach Metadata service: Internal Server Error.

ERROR:root:Command '['/tools/google-cloud-sdk/bin/gsutil','-o','GoogleCompute:service_account=default','cp','-R','gs://cml-365057443918-1608667078774578/models/xsqr_global/v6/7349456410861999293/model/*','/tmp/model/0001']' returned non-zero exit status 1.

ERROR:root:Error loading model: 'generator' object has no attribute 'next'

ERROR:root:Error loading the model

  • 框架/机器学习运行时版本:Tensorflow 1.15.0
  • Python: 3.7.3

奇怪的是 gcloud ai-platform local predict 与这个导出的模型一起正常工作,而且我可以在区域端点上部署这个完全相同的模型而没有问题.如果我尝试使用全局端点模型,它只会出现此错误。但我需要全局端点,因为我计划使用自定义预测例程(如果我可以先让这个基本模型工作)。

日志似乎表明从存储复制模型有问题?我已尝试为各种 IAM 角色授予额外的查看者权限,但仍然遇到相同的错误

感谢您的帮助。

解决方法

我认为这与 https://issuetracker.google.com/issues/175316320

是同一个问题

问题中的评论说修复程序现在正在推出。