XGBoost-稀疏时间序列的数组,作为分类器的一种输入

问题描述

我有在线活动数据,对于每个用户,它包含N个(例如N = 410)非常稀疏的时间序列,跨越一些M实例(M可以是几十或几千,在这里并不重要)。这些是整数,但大多数为零。因此,X输入数据是一个2D数组,整个矩阵是一个观测值。

对于这样的N个时间序列集合,我需要分配一个标签y并建立二进制分类器,或者在相关任务中执行回归。

现在XGB和相关分类器仅接受特征向量Dim = 1数组。

我尝试将垂直UMAP简化为一维值(每个N时间序列的垂直切入是24小时内的总体用户活动),以获取一维要素阵列,例如一周,但效果不佳,许多可能的原因之一可能是数据稀疏。

是否有一些不错的方法来构造这样的分类?还是“规范”方法

如何将多个非常独立的功能系列同时提供给XGBoost(或其他分类器)?

是否存在一些适用于稀疏时间序列集合的良好嵌入?

我在网上搜索,但与我的案子没有什么真正的联系。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)