问题描述
我有N个观察到的无序序列(集合)作为特征和二进制标签。 示例:
{'Apple','Watermelon','Beer'}:0
{'Bread'}:1
{'Laptop','Mouse','Keyboard'}:0
我想要一种用于类预测的算法。 我可以应用哪种算法对此类数据进行分类? 我正在使用python。
谢谢。
解决方法
我认为首先您需要一种将多个大小的单词序列编码为固定大小的特征向量的方法。您可以使用自然语言处理中使用的某些编码方法。我在该地区没有太多经验。但是以下链接似乎有一个解释和可能使用的库: https://medium.com/modern-nlp/on-variety-of-encoding-text-8b7623969d1e 找到编码方法后,可以使用简单的多层神经网络对该任务进行分类。