Red-Piranha是一个开源搜索系统,它能够真正”学习”你所要查找的是什么.Red-Piranha
这是一个基于 WAP 的搜索引擎,采用 Perl 语言开发,通过这个脚本你可以给你的WAP网站增加搜索功能。
iPhone和Mac用户终于可以开发自己的Bing引用了,来自CodePlex的最新Bing SDK已经公布,它基于Microsoft Public
DBSight是一个J2EE的搜索平台,可扩展的即时全文搜索任何关系型数据库,对初学者和专家。它具有内置的数据库抓取以下用户定义的SQL
DataparkSearch 搜索引擎是一个 C 语言的全功能的开源基于Web的搜索引擎,
支持来自 http, https, ftp, nntp, and news URLs, htdb virtual URL 的数据,内嵌支持数据库、
Beagle 是一个桌面的搜索引擎,用于在电脑中搜索个人文档。
JDesktopSearch是一个基于Apache Lucene实现的桌面搜索引擎。它能够索引HTML、XML、OpenOffice、MS
Sphinx是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索。Sphinx特别为一些脚本语言设计搜索API接口,如PHP
Tika是一个内容抽取的工具集合(a toolkit for text
extracting)。它集成了POI,Pdfbox
并且为文本抽取工作提供了一个统一的界面。其次,Tika也提供了便利的扩展API,用来丰富其对第三方文件格式的支持。
Xapian是一个用C编写的全文检索程序,他的作用类似于Java的lucene。尽管在Java世界lucene已经是标准的全文检索程序,但是C/C世界并没有相应的工具,而Xapian则填补了这个缺憾。
JendX提供跨平台全文本索引、搜索和预览功能。支持可以转换成普通文本的任何文档。支持Web-Start,100% Java,使用lucene 搜索引擎。
php_solr 是一个轻量级的 Apache Solr
(企业级搜索服务器)的PHP客户端库。
ExpressSearch 是 ExpressMe
建站系统所用的Lucene搜索引擎的封装。
示例代码:
Searcher createSearcher() {
Mustru是一个桌面搜索引擎,基于Lucene、Wordnet、Lingpipe、GATE和Berkeley
DB等开源项目开发。能够对本地文件系统的多个目录进行索引,然后使用一个Web界面查询该索引。Mustru提供的功能包括:
中文社区的全文搜索功能一直是个让人头疼的问题,其实追根究底是由MySQL自身的问题造成的。当数据量大的时候,任何的RDBMS的查询都无法满足现今互联网的要求。
基于Lucene的全文检索框架
一、 介绍
基于Lucene的全文检索框架,提供快速方便的索引创建及查询方式,并提供扩展功能对框架进行扩展。
从名字就可以看出,这是 Solr 的 PHP 客户端开发包。
示例代码:
require_once(‘Apache/Solr/Service.php’);
Zend_Search_Lucene 是一个完全由 PHP 5
编写的通用文本搜索引擎。由于其将索引保存在文件系统中而不需要数据库支持,因此它几乎可以为任何由 PHP
imgSeek 的桌面版本是一个免费的开源可视相似性项目集合。我可以将此查询表述为我所绘制的一个草图或我提供的另一个图像。imgSeek
Seeks 是一个Web搜索代理引擎,一个实时的P2P模式匹配网络,用于搜索社会化网络。可进行去中心化搜索数据合并,而这些对用户来说都是透明。
Whoosh 是一个纯python实现的全文搜索组件。Whoosh不但功能完善,还非常的快。
Whoosh的作者是MattChaput,由Side Effects Software公司开发。项目的最初用于Houdini(Side Effects
ASPSeek是一个C++编写的免费开源互联网搜索引擎,并使用了STL库。它主要包括一个检索机器人,一个搜索守护程序,和一个搜索前端(CGI或者是Apache模块)。搜索结果可以限定在给定的时间或站点,站点空间,并按照相关性
LucidGaze for Solr 是由 Lucid 开发的开源solr 监测工具,提供快照、存储、交互视图、比较各种 solr 性能指标。 包括:
Lucene.Net开源项目转向商业化后,DotLucene以Lucene.Net作为基础继续进行开发。
目前该项目已关闭!
bobo-browse
是一用java写的lucene扩展组件,通过它可以很方便在lucene上实现分组统计功能。
Nut
是一个为lucene提供分布式搜索的框架。理论上可对千G以上索引文件支持数千万级的用户搜索访问。Nut由Client、Server、Cache和DB四
Elasticsearch 是一个分布式的 RESTful 风格的搜索和数据分析引擎,能够解决越来越多的用例。作为 Elastic Stack
Zoie 是一个基于Apache Lucene构建的实时搜索和索引系统。
caterpillars工具主要用来提供文本预处理功能。输入文本全文及其该文本的字典,字典是手动制作,输出两个二进制格式的全文索引文件。用户可以直接根据这两个索引文件,实现嵌入式设备上的文本查询,缩短嵌入式设备
Yahoo BOSS (Build your Own Search Service) 是 PHP 的 Yahoo
搜索客户端API,可通过它获取来自网页的搜索结果、新闻和图片等,并进行缓存。
zettair 是全文检索界鼎鼎大名的大牛:Justin Zobel,以他的研究成果为基础的全文检索实验系统。
Terrier
是一个用来快速开发Web、企业内部网、桌面搜索引擎的软件,是一个模块和的平台用来构建大规模的信息获取应用,提供索引和数据获取功能,提供一个桌面搜索应用。
SmartMe一款小巧的搜索资源管理器。您是否曾因在一个搜索引擎中得不到需要的结果而失望?您是否曾为一遍又一遍地在搜索框内输入关键词而厌烦?您是否曾经在网速缓慢的时候为等待谷歌的主页而烦躁?
Solandra (原名为 Lucandra) = Cassandra +Lucene
Solandra = Solr +Cassandra
Solandra 是一个实时的分布式搜索引擎,基于 Apache Solr 和Apache Cassandra 构建.
Apache Lucy 是一个全文搜索引擎库,使用 C 语言编写,主要面向一些动态语言,目前提供 Perl 语言的绑定。相当于是 C 语言版的Lucene 。
HubbleDotNet 是一个基于.net framework 的开源免费的全文搜索引擎组件。开源协议是 Apache