当我的数据集在Google BigQuery ML中仅为2.4gb时,为什么为查询处理的字节为100GB?

问题描述

我为一个2.4gb的非外部表运行了一个创建模型,该表运行了14小时25分钟,如图所示

enter image description here

This is the job information

第一张图片显示,我的查询在运行时将处理2.4gb。 第二个人说,它处理并计费了100GB。知道为什么吗?

解决方法

对于时间序列模型(假设这是您所拥有的),当为自动超参数调整启用了自动调整功能时,将在训练阶段拟合并评估多个候选模型。在这种情况下,输入SELECT语句处理的字节数乘以候选模型的数量,可以通过AUTO_ARIMA_MAX_ORDER训练选项进行控制。

此外,对于迭代模型,CREATE MODEL语句在50次迭代时停止。

结合以上两个事实和您的数字(2和100)-看起来就是在解释/回答您的问题