问题描述
我上传了一个具有4000条记录的文件,用于批量预测。数据包含86个变量,这是一个二进制分类任务。我将Cloud Storage指定为我的输出目标。批量预测返回的CSV文件只有3730条记录。我想知道为什么输出中缺少一些记录。错误文件为空,所以我不知道。你有什么建议吗?
解决方法
某些输入数据损坏,丢失或以其他方式与模型不兼容时,可能会发生您所遇到的行为。完整的要求可以在preparing your training data页上找到。
因此,我建议您检查输入文件,否则您的模型将继续产生错误。此外,请查看以下paragraphs:Clean up missing,incomplete,and inconsistent data
和Analyze your data after importing
:
您还应该查看每列的可为空性,这可以确定 列是否可以包含缺失值或NULL值。
另外,如果批处理量很大,那么失败的预测可能比您预期的要多。
,我遇到了同样的问题-缺少预测,错误表为空。我正在从GCS加载csv。
我已验证列为可为空。在可为空的列中确实有混合类型# Production depends on precompilation of packs prior to booting for performance.
compile: false
和str
。可能是问题所在吗?
谢谢!