JendX提供跨平台全文本索引、搜索和预览功能。支持可以转换成普通文本的任何文档。支持Web-Start,100% Java,使用lucene 搜索引擎。
php_solr 是一个轻量级的 Apache Solr (企业级搜索服务器)的PHP客户端库。
ExpressSearch 是 ExpressMe 建站系统所用的Lucene搜索引擎的封装。 示例代码: Searcher createSearcher() {
Mustru是一个桌面搜索引擎,基于Lucene、Wordnet、Lingpipe、GATE和Berkeley DB等开源项目开发。能够对本地文件系统的多个目录进行索引,然后使用一个Web界面查询该索引。Mustru提供的功能包括:
中文社区的全文搜索功能一直是个让人头疼的问题,其实追根究底是由MySQL自身的问题造成的。当数据量大的时候,任何的RDBMS的查询都无法满足现今互联网的要求。
基于Lucene的全文检索框架 一、 介绍 基于Lucene的全文检索框架,提供快速方便的索引创建及查询方式,并提供扩展功能对框架进行扩展。
从名字就可以看出,这是 Solr 的 PHP 客户端开发包。 示例代码: require_once(‘Apache/Solr/Service.php’);
Zend_Search_Lucene 是一个完全由 PHP 5 编写的通用文本搜索引擎。由于其将索引保存在文件系统中而不需要数据库支持,因此它几乎可以为任何由 PHP
imgSeek 的桌面版本是一个免费的开源可视相似性项目集合。我可以将此查询表述为我所绘制的一个草图或我提供的另一个图像。imgSeek
Seeks 是一个Web搜索代理引擎,一个实时的P2P模式匹配网络,用于搜索社会化网络。可进行去中心化搜索数据合并,而这些对用户来说都是透明。
Whoosh 是一个纯python实现的全文搜索组件。Whoosh不但功能完善,还非常的快。 Whoosh的作者是MattChaput,由Side Effects Software公司开发。项目的最初用于Houdini(Side Effects
ASPSeek是一个C++编写的免费开源互联网搜索引擎,并使用了STL库。它主要包括一个检索机器人,一个搜索守护程序,和一个搜索前端(CGI或者是Apache模块)。搜索结果可以限定在给定的时间或站点,站点空间,并按照相关性
LucidGaze for Solr 是由 Lucid 开发的开源solr 监测工具,提供快照、存储、交互视图、比较各种 solr 性能指标。 包括:
Lucene.Net开源项目转向商业化后,DotLucene以Lucene.Net作为基础继续进行开发。 目前该项目已关闭!
bobo-browse 是一用java写的lucene扩展组件,通过它可以很方便在lucene上实现分组统计功能。
Nut 是一个为lucene提供分布式搜索的框架。理论上可对千G以上索引文件支持数千万级的用户搜索访问。Nut由Client、Server、Cache和DB四
Elasticsearch 是一个分布式的 RESTful 风格的搜索和数据分析引擎,能够解决越来越多的用例。作为 Elastic Stack
Zoie 是一个基于Apache Lucene构建的实时搜索和索引系统。
caterpillars工具主要用来提供文本预处理功能。输入文本全文及其该文本的字典,字典是手动制作,输出两个二进制格式的全文索引文件。用户可以直接根据这两个索引文件,实现嵌入式设备上的文本查询,缩短嵌入式设备
Yahoo BOSS (Build your Own Search Service) 是 PHP 的 Yahoo 搜索客户端API,可通过它获取来自网页的搜索结果、新闻和图片等,并进行缓存。
zettair 是全文检索界鼎鼎大名的大牛:Justin Zobel,以他的研究成果为基础的全文检索实验系统。
Terrier 是一个用来快速开发Web、企业内部网、桌面搜索引擎的软件,是一个模块和的平台用来构建大规模的信息获取应用,提供索引和数据获取功能,提供一个桌面搜索应用。
SmartMe一款小巧的搜索资源管理器。您是否曾因在一个搜索引擎中得不到需要的结果而失望?您是否曾为一遍又一遍地在搜索框内输入关键词而厌烦?您是否曾经在网速缓慢的时候为等待谷歌的主页而烦躁?
Solandra (原名为 Lucandra) = Cassandra +Lucene Solandra = Solr +Cassandra Solandra 是一个实时的分布式搜索引擎,基于 Apache Solr 和Apache Cassandra 构建.
Apache Lucy 是一个全文搜索引擎库,使用 C 语言编写,主要面向一些动态语言,目前提供 Perl 语言的绑定。相当于是 C 语言版的Lucene 。
HubbleDotNet 是一个基于.net framework 的开源免费的全文搜索引擎组件。开源协议是 Apache
solr_pager 是一个 SOLR 的分页插件,用以对 SOLR 的搜索结果进行分页。
Reds是由LearnBoost公司的TJ Holowaychuk开发的一个基于Redis的Node.js全文搜索引擎,其代码加上注释也只有300行。不得不说又是一个Redis的最佳实践,它的主要原理是通过Redis的sets数据结构将分词后的词语碎片进行
Tokyo Dystopia 是一个全文搜索系统,主要特性: 高性能搜索 文档的可伸缩性 Perfect recall ratio by character N-gram method
Hawk 搜索引擎平台是面向中小型网站,可以定制的垂直搜索引擎平台。本搜索引擎平台目标是方便用户搭建站内搜索、某个领域的垂直搜索、以及检索个人文档以及自己关注的网站信
Maven Lucene Plugin 是一个开源的 Maven 的Lucene 插件。
随着互联网技术向宽带、高速、多媒体方向的发展,人类正快速进入一个信息化的时代。各种信息工具、技术、载体等应运而生。在众多类型的信息资源中,图像具有直观、形象、易于理解和信息量大等特点,成为资源库的重
gosphinx 为 Sphinx 搜索引擎提供了 Go 客户端开发包。
基于solr的中文搜索引擎框架(Chinese search engine base on solr) 本搜索引擎框架实现了针对中文文本索引 搜索的基本功能和扩展接口
LuciMint(Lucene Index薄荷糖)是一个基于Lucene的全文索引小组件,它封装了Lucene的底层对Document对象的操作,提供了一个面向用户数据格式的,轻量级的索引操作接口。
Argos是一个结构化数据的搜索引擎。 它不仅包含全文搜索引擎的功能,还针对结构化数据搜索提供了丰富的支持。