带有额外元数据的稀疏向量python NumPy

问题描述

我有一个数据集,其中一行看起来像这样(g_1 到 g_n 是具有整数值的动态列):

["day_of_week","hour_of_day","timestamp",g_1,g_2,g_3,...,g_n]
[       2,3,2021-06-05 13:00,4,23,100,12 ]

这个想法是只将每一行的动态列转换为稀疏向量,并以某种方式将元数据(day_of_week、hour_of_day)附加到它。之后,我将使用这些稀疏向量来执行 k-meansma​​rkov-chains(基于计算的集群)。 我需要最后的元数据来打印一些信息。

问题是:如何在python中将元数据附加到稀疏向量上,或者,在执行聚类和马尔可夫链之后,是否有更好的方法来确定哪些元数据属于每个稀疏向量?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)