Python的全文搜索引擎Whoosh的Flask扩展
Fess是一个开源的全文检索服务器,你能快速的安装和运行它在任何有Java运行环境的平台。
Techu 是一个基于 RESTful 的搜索服务器,基于 Sphinx
全文搜索引擎。
特点:
通过 Techu 数据库模型组织 Sphinx 配置
ElasticHQ 是一个基于浏览器的直观和功能强大的 ElasticSearch管理和监控工具,它提供了对 ElasticSearch
Lucene Query Tool (lqt) 是一个命令行工具用来执行 Lucene 查询并对结果进行格式化输出。
PHP Sphinx 是 Sphinx 搜索引擎的 PHP 客户端开发包。
UMAD
主要包括三个部分:相似性搜索,分类和异常值检测。这三个方法都是基于度量空间的数据项,包括类似图片,视频,DNA,蛋白质等的复杂对象,这会消耗很大一部分
基于Lucene框架技术实现的YMP全文检索模块,有关YMP框架内容点这里。
django-haystack
为Django提供了模块化的搜索,它提供一个统一的、友好的API,允许您插入不同的搜索后端(如Solr,Elasticsearch,Whoosh,Xapian,等等)而不需要修改代码。
1、概述
不管程序性能有多高,机器处理能力有多强,都会有其极限。能够快速方便的横向与纵向扩展是Nut设计最重要的原则,以此原则形成以分布式并行计算为核心的架构设计。以分布式并行计算为核心的架构设计是Nut区
ALTSE是另一种搜索引擎技术。指数高达几百万的网页。
Altse并不旨在取代现有的搜索引擎技术,如谷歌,雅虎,等等。相反,它的目的是提供一个负担得起的替代索引的网页小规模的企业和组织。
rank是一个seo工具,用于分析网站的搜索引擎收录排名。
1、指定一个栏目入口页面,配置标题的CSS路径,配置下一页的CSS路径,配置下一页的标签文本,返回所有的文章标题和URL列表
MySQL在高并发连接、数据库记录数较多的情况下,SELECT … WHERE … LIKE
‘%…%’的全文搜索方式不仅效率差,而且以通配符%开头作查询时,使用不到索引,需要全表扫描,对数据库的压力也很大。MySQL针对这一问题提
这几年nodejs越来越火爆,js程序员们终于可以不局限于浏览器那一亩三分地了,很多以前由java,c等实现的东西纷纷有了nodejs版本,我也随波逐流一把,写了一个nodejs的搜索引擎addon
Fullproof 是一个 JavaScript 库,提供了在浏览器上的高质量的全文搜索引擎。
该特性可让你的 Web 应用在离线模式下使用 HTML5 离线特性进行搜索。
DDH垂直搜索引擎,开源授权协议 LGPL ,
是目前互联网中唯一可以商业运作的垂直搜索引擎系统,由JAVA语言开发,可以运行在大规模集群中的网络信息整合系统。DDH整合Nutch(开源搜索引擎系统),UCI(网页信息抽取系
Haystack 是 Django 框架的搜索扩展模块。Haystack 提供统一的
API 允许你使用不同的搜索后端,包括 Solr,Elasticsearch,Whoosh,Xapian 等等。
Psearch基于MySQL与Sphinx的分类搜索引擎接口框架,基于此程序可快速搭建分类搜索引擎,能基本满足中小网站搜索需求。
lunr.js 实现了在网页上的搜索引擎,类似 Solr。
示例代码:
//定义索引
var idx = lunr(function () {
Krugle 是一个程序代码搜索引擎。收录了主流的开源软件的代码。提供免费版本下载
本软件可以帮助Rails项目快速实现搜索/过滤页面。具体使用,请参照软件主页里的说明。
姓名搜索是一个比较常用的功能,比如QQ联系人搜索,电影名搜索等
只需要输入几个简单的首字母就能搜索到对应的内容
基于语言模型和检索模型的搜索工具,国外用来学习检索模型和倒排表索引的好东西。
LGTE 是基于 Lucene 提供了扩展 Lucene API
用于集成很多服务,例如片段生成、查询扩展等等,并提供了一组单元测试。
SimpleSearch(SPS)是在linux平台下使用c/c++开发,专为PHP开发人员而研发的一款搜索引擎,其基于Xapian开发,目标是让所有PHP开发人员都很容易解决百万级数量以上的全文检索需求。
Searchdaimon
ES是一个针对公司数据和网站的搜索引擎,拥有一个功能强大的管理员界面。ES可以索引一些常用的企业系统中的数据,比如SharePoint、Exchange、SQL数据库、Windows文件共享等,它还支持多种数据源,比如
系统特色
基于Lucene核心,支持全文检索,查询统计快速高效。
支持SQL语法、数据类型、JDBC驱动标准,使用简单方便。
Bigdesk 是 ElasticSearch 的一个集群监控工具,可生成ElasticSearch
集群的即时图表和统计信息。可以通过它来查看es集群的各种状态,如:cpu、内存使用情况,索引数据、搜索情况,http连接数等。版本对应关系表:
Apache ManifoldCF 提供一个开源框架,用于连接源内容库,如:Microsoft Sharepoint、EMC Documentum等,
Elasticsearch 的 Python
client,提供较为方便的查询语法。
SQL
select * from “ExampleModel” where “name” = “tina”
ElasticQuery 是用于 ElasticSearch
的简单查询构建器。可使用 metod 方法调用和相应的参数来生成查询、过滤和聚合对象。输出的 dict/json 可直接传递给 ES。
solr-sql是针对solrcloud封装的sql编程接口,主要支持SELECT…FROM…WHERE查询语句。
FTServer(FTS)是一个轻量精准全文搜索服务器,使用英文规则处理英文,使用中文规则处理中文,不需要切割中文为单词,可以支持中文字的任意排列,精准搜索中文长句子,轻松处理古文古诗词,写意句子不影响搜索,不依
jsKeyword
采用树形结构,可以从大量标签中迅速进行模糊检索,或从超长文本中检索标签,轻松实现搜索和自动完成功能。在线演示
简介
由于Elasticsearch没有提供权限管理功能(官方shield又收费),特开发此Proxy,可以针对Elasticsearch Rest的路径设置权限,可以指定信任IP,支持用户,群组授权
Hermes 的出现,并不是为了替代 Solr、ES 的,就像 ES 的出现并不是为了干掉 Oracle 和 MySQL 一样,而是为了满足不同层面的需求。