关键字搜索引擎,它返回统计信息而不是点击数

问题描述

| 关于StackOverflow的第一篇文章,但是我一直把这个站点看作是共享知识的重要来源,而且我很高兴看到这个问题会带来什么。 据我所知,我现在已经达到了使用SQL索引,统计信息和全文本搜索所能达到的极限,我目前正在寻找一种可以为我们提供所需功能的搜索库。我不愿意自己编写它(如果可以得到老板的认可,则将其开源),但是我宁愿找到已经存在的开源软件,natch。 我们所需要的是一个搜索引擎,它可以提供有关用户搜索特定关键字时匹配结果的统计信息。例如,假设我们正在谈论在线商店中的产品数据库。我们需要能够返回有关与给定关键字集匹配的产品数量的统计信息(并且还能够按价格,类别等过滤此结果集)以及库存产品的总数(假设它存储在产品表的字段中)。我发现的所有搜索引擎都返回前n个结果,并且如果您想要有关结果集大小的统计信息,则需要枚举整个集合。即使您没有,也仍然需要这样做以检索库存中的产品总数。 有没有人知道可以使用此功能?就像我说的那样,我很高兴自己动手做,要么自己动手做,要么修改Lucene之类的功能,但是我一直无法在Google上找到合适的东西。 在此先感谢大家!     

解决方法

这里要记住的一点是“枚举所有结果”可能意味着完全不同的东西-“ 0”与进行实际获得每个对象所需的所有联接等有很大不同。在Lucene和关系数据库中都是如此。因此,我不会担心文档说“我们会列举所有结果”的事实。 根据我的经验,Solr的标准外观可缩放到99%的人所需。如果您处于1%的水平(即您的数据库很大),那么我可以建议一些方法来猜测结果,这样可以更快。但是Solr可能会为您工作。     ,您可能会看看Solr,它是基于Lucene构建的多面搜索引擎。除了进行全文搜索之外,Solr还会为您计算很多不同的事情。它擅长处理结构化数据和全文数据的组合。     ,  据我所知,我现在已经达到了使用SQL索引的极限 你确定吗?我问,因为如果您使用MySQL,则可能要研究PostgreSQL的全文本搜索功能。尤其是将其与btree_gin和trigram模块结合使用时,以及非常体面的说明功能使您可以从高度复杂的查询中提取合理的行估计值。     

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...