使用REST API

问题描述

与此处提出的问题类似的问题-exclude columns from dataset in GCP AutoML Tables,但更为复杂

我正在使用AUTOML表,但是从sql数据库创建CSV文件来训练模型,在后端,当需要对新数据进行预测时,提交CSV文件,然后从中获取输出CSV文件GCP存储桶中的文件夹。

我的问题是,在训练模型后,当您提交新数据进行评分时,是否可以以编程方式在CSV训练中传递未在模型训练中使用的唯一ID,以便我可以使用该ID以确保将正确的分数分配给批次中的记录?

或者,如果训练后的模型的模式要求该唯一ID以读取预测请求CSV(因为它在模式中可能需要相同数量的变量),则可以传递变量(唯一ID)在模型训练中,但没有在训练中使用此变量(因为我不想在唯一ID中引入任何意想不到的偏见)?

我可以看到使用python可以实现的目标,但是我无法在REST文档中的任何地方找到可以使用API​​的地方。

任何帮助表示赞赏。

解决方法

Google Cloud AutoMLAutoML API REST表示为程序接口,可通过REST HTTP调用或流行编程语言的客户端库访问不同的ML模型方法。

尤其是对于AutoML Tables产品,正如我在评论中提到的那样,您可能可以组成models.create API method,定义适当的TablesModelMetadata metadata模型,在准备好的数据集上触发训练过程。

进一步发现TablesModelMetadata JSON形式,您可以找到inputFeatureColumnSpecs字段,您可以在其中指定表的columns,并在该字段上训练模型。

根据inputFeatureColumnSpecs的描述,如果此字段中未存储任何列名,则所有主表的列均用于训练和预测输入,除了 target_column weight_column ml_use_column