AutoML表批量预测-丢失的记录

问题描述

上传一个具有4000条记录的文件,用于批量预测。数据包含86个变量,这是一个二进制分类任务。我将Cloud Storage指定为我的输出目标。批量预测返回的CSV文件只有3730条记录。我想知道为什么输出中缺少一些记录。错误文件为空,所以我不知道。你有什么建议吗?

解决方法

某些输入数据损坏,丢失或以其他方式与模型不兼容时,可能会发生您所遇到的行为。完整的要求可以在preparing your training data页上找到。

因此,我建议您检查输入文件,否则您的模型将继续产生错误。此外,请查看以下paragraphsClean up missing,incomplete,and inconsistent dataAnalyze your data after importing

您还应该查看每列的可为空性,这可以确定 列是否可以包含缺失值或NULL值。

另外,如果批处理量很大,那么失败的预测可能比您预期的要多。

,

我遇到了同样的问题-缺少预测,错误表为空。我正在从GCS加载csv。 我已验证列为可为空。在可为空的列中确实有混合类型# Production depends on precompilation of packs prior to booting for performance. compile: false str。可能是问题所在吗?

谢谢!