使用 PyTorch Transformer Encoder Block 进行无监督聚类

问题描述

我正在尝试对音乐数据集（以整数表示的音符）执行无监督聚类任务。在使用 k-means 对它们进行聚类之前，我想使用 Transformer 对不同歌曲之间的相关性进行编码，并且我对如何最好地解决这个问题有些困惑。我最初的想法是取encoder层的输出，直接应用聚类方法，但是每个向量的维度从输入到输出急剧增加（从100到10000），这不适合聚类。我不确定这是否是我自己的实现错误，但我想知道以下内容：

编码器层输出的维度相对于输入应该是什么
这些输出实际上意味着什么？（我只找到了解决解码器层输出的解释）
直接对这些输出进行聚类是否合适，还是应该先应用其他函数？

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

cluster-analysis machine-learning python pytorch transformer