为排名模型创建Catboost池时出错

问题描述

我正在尝试使用catboost库构建排名模型。在训练集上创建一个池时,出现以下错误

catboostError: catboost/private/libs/data_types/query.cpp:25: Error: queryIds should be grouped

我用来对行进行分组的列是一个字符串数组列。在我看到的示例中,它们大多是整数数组。以前有人遇到过类似的问题吗?

解决方法

我有同样的问题 使用以下代码时

train_data = Pool(
            data=input_data[['input_col']],label=input_data[['score']],group_id=input_data[['query_id']],text_features=text_features
)

使用 input_dataquery_id 排序后得到解决

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...