C ++中的自动完成库

问题描述

| 我需要一百万个单词的C ++自动完成例程或库。我想我可以在网上找到像rabin–Karp这样的例程。您知道这样做的图书馆吗?我在Boost中看不到它。 另外,使用MysqL LIKE sql请求执行此操作是否是个疯狂的主意? 谢谢 编辑:的确,这比我需要的自动完成功能更多的建议(当用户键入前两个字母时,建议十个单词)。我实际上也有“尼康数码相机”的表达。但是对于第一个版本,我只需要尼康的“ Ni”而不是“数码相机”的建议。     

解决方法

        如果从准备索引开始,则不必使用任何疯狂的算法。 一个简单的Trie / Binary Search Tree结构,保持单词按字母顺序排列,将允许有效的前缀搜索。 例如,在C ++中,
std::map
类具有
lower_bound
成员,该成员将在O(log N)中指向可能扩展您单词的第一个元素。     ,        嗯,如果您正在考虑使用like,则意味着您最有可能希望拥有经典的自动补全功能(单词开头是匹配的)。 将您的数据组织成一个26棵树(很好)(每个字母一个条目,或者如果您支持除字母之外的其他选择,一个精心选择的x棵树)怎么样?这样,您就可以一次组织数据,然后通过树解析即可快速获得结果。如果要限制自动完成中建议的结果量,则可以调整树解析算法。看起来简单而高效(SQL中类似的语法每次都必须比较表中的所有项目,而一旦正确设置数据,我的解决方案就会更快) 其他解决方案,您可以查看QCompleter的Qt实现(依靠Qt依赖您的代码可能会过大,我不知道)     ,        我曾经从事过一个项目,该项目使用CLucene做了类似的事情。工作正常。     ,        您可以使用特里(前缀树)来存储您的单词。
struct trie
{
  std::map<char,trie*> next;
  bool is_word;

  void insert(std::string w)
  {  
    trie * n = this;
    for (int i = 0; i < w.size(); ++i) {
      if (n->next.find(w[i]) == n->next.end()) {
        n->next[w[i]] = new trie();
      }
      n = n->next[w[i]];
    }
    n->is_word = true;
  }
};
然后,您可以轻松获得在子树上迭代的前缀匹配。     ,        您可以使用Damerau-Levenshtein距离编写自己的简单自动完成函数。