用于聚类的用户行为序列模式检测

问题描述

我需要在一组固定大小的字符串中检测可变大小的模式,其中每个字符串代表一组用户的活动序列。

例如,我有一个 10 个字符的字符串或用户 1,其中每个字符代表一个活动强度:'LLMLLMGLML' 意味着前 2 个样本为低强度,第三个为中等强度,然后活动变低再次。另一个示例,对于 user2:'LMMGMLLMLL'。两个用户都有一个共同的模式:'LLMLL'

我的目的是根据用户的整体活动对用户进行分类,根据常见模式的数量定义相似性

你能推荐一种解决这个问题的方法吗?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)