问题描述
我正在尝试使用catboost库构建排名模型。在训练集上创建一个池时,出现以下错误。
catboostError: catboost/private/libs/data_types/query.cpp:25: Error: queryIds should be grouped
我用来对行进行分组的列是一个字符串数组列。在我看到的示例中,它们大多是整数数组。以前有人遇到过类似的问题吗?
解决方法
我有同样的问题 使用以下代码时
train_data = Pool(
data=input_data[['input_col']],label=input_data[['score']],group_id=input_data[['query_id']],text_features=text_features
)
使用 input_data
对 query_id
排序后得到解决