Annoy 如何索引嵌入？

编程问答 2022-05-28

问题描述

我想了解 Annoy Indexing 的工作原理..我参考了以下文档： https://github.com/spotify/annoy#how-does-it-work
https://cloud.google.com/solutions/machine-learning/building-real-time-embeddings-similarity-matching-system
这些文档解释了如何从 annoy 获取索引，但没有解释索引是如何创建的？

假设我有 3 维的句子嵌入矩阵（为简单起见）

[[1,2,3]                
[4,3]             
[1,1,1]]

查看许多资源让我在以下方面感到困惑：

Annoy 会先将这些索引编入索引，然后再用于查找最近的邻居吗？
应用最近邻树，然后根据邻居索引？这似乎是最合适的。如果是，那么它如何索引？我想知道它背后的算法..

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

annoy cluster-analysis indexing indexing nearest-neighbor