C ++中的自动完成库

问题描述

| 我需要一百万个单词的C ++自动完成例程或库。我想我可以在网上找到像rabin–Karp这样的例程。您知道这样做的图书馆吗？我在Boost中看不到它。另外，使用MysqL LIKE sql请求执行此操作是否是个疯狂的主意？谢谢编辑：的确，这比我需要的自动完成功能更多的建议（当用户键入前两个字母时，建议十个单词）。我实际上也有“尼康数码相机”的表达。但是对于第一个版本，我只需要尼康的“ Ni”而不是“数码相机”的建议。

解决方法

如果从准备索引开始，则不必使用任何疯狂的算法。一个简单的Trie / Binary Search Tree结构，保持单词按字母顺序排列，将允许有效的前缀搜索。例如，在C ++中，std::map类具有lower_bound成员，该成员将在O（log N）中指向可能扩展您单词的第一个元素。 , 嗯，如果您正在考虑使用like，则意味着您最有可能希望拥有经典的自动补全功能（单词开头是匹配的）。将您的数据组织成一个26棵树（很好）（每个字母一个条目，或者如果您支持除字母之外的其他选择，一个精心选择的x棵树）怎么样？这样，您就可以一次组织数据，然后通过树解析即可快速获得结果。如果要限制自动完成中建议的结果量，则可以调整树解析算法。看起来简单而高效（SQL中类似的语法每次都必须比较表中的所有项目，而一旦正确设置数据，我的解决方案就会更快）其他解决方案，您可以查看QCompleter的Qt实现（依靠Qt依赖您的代码可能会过大，我不知道） , 我曾经从事过一个项目，该项目使用CLucene做了类似的事情。工作正常。 , 您可以使用特里（前缀树）来存储您的单词。

struct trie
{
  std::map<char,trie*> next;
  bool is_word;

  void insert(std::string w)
  {  
    trie * n = this;
    for (int i = 0; i < w.size(); ++i) {
      if (n->next.find(w[i]) == n->next.end()) {
        n->next[w[i]] = new trie();
      }
      n = n->next[w[i]];
    }
    n->is_word = true;
  }
};

然后，您可以轻松获得在子树上迭代的前缀匹配。 , 您可以使用Damerau-Levenshtein距离编写自己的简单自动完成函数。

++完成完成自动自动