RediSearch是一个高性能的全文搜索引擎,可作为一个Redis Module 运行在Redis上,是由RedisLabs团队开发的。
riot 分布式全文搜索引擎, 采用 Go 语言开发。功能特性:
高效索引和搜索(1M条微博500M数据28秒索引完,1.65毫秒搜索响应时间,19K搜索QPS)
Phinde 是一款通用网络搜索引擎,可以使用在静态博客或任何其他网站,实现你想要的搜索功能。
Ncgrep
基于文本图形(ncurses)的文本搜索工具
背景
作为一个 VIM 党,日常工作开发中,会经常利用 grep 进行关键词搜索,以快速定位到文件。如图:
OpenGallery 是一个图片搜索引擎项目,建立在 PHP5 、MySql 和 Memcached 基础上进行的全字符搜索,有 Docker 安装。
Searx是一个免费的互联网元搜索引擎,汇集了70多种搜索服务的结果。 用户既不被跟踪也不被分析。 此外,searx可以在Tor上实现在线匿名搜索。
Milvus 向量搜索引擎能够帮助用户轻松应对海量非结构化数据(图片/视频/语音/文本)检索。单节点 Milvus
Angular InstantSearch 是 Algolia 发布的 Angular
专用版搜索组件。
核心特性
兼容Angular 4 和 5,不兼容Angular 1 和2
Rucene 是 Lucene 的 Ruby 语言实现版本,由知乎公司开发。目前该项目还没有完成
Jkes 是一个基于Java、Kafka、ElasticSearch的高性能搜索框架。它提供了注解驱动的JPA风格的对象/文档映射,使用rest
Open Distro for Elasticsearch 是 AWS 开源的 Elasticsearch 发行版。
基于 Apache 2.0,由社区推动,100% 开源,Open Distro for Elasticsearch 除了
chinese-search 是一个全文检索组件,基层实现依赖 nodejieba 中文分词和 redis 集合存储。比 MySQL 更轻便更敏捷。
elasticsearch-py 是 ElasticSearch
官方出品的 Python 客户端开发包。
示例代码:
>>> from datetime import datetime
移动和保存索引的工具。
版本警告!
Elasticdump 1.0.0 的版本更改转储创建的文件的格式。使用0.x.x版本创建的文件可能不适用于当前的版本,而且会导致内存不足。
Elasticsearch的背包插件。
Knapsack是Elasticsearch的“swiss
knife”导出/导入插件。它使用压缩算法(gzip,bzip2,lzf,xz)使用压缩格式(tar,zip,cpio)和Elasticsearch批量格式。
Sonic 是一个快速、轻量级、无模式的搜索后端。Sonic 接收搜索文本和标识符元组,然后可以在一微秒的时间内对其进行查询。
The best elasticsearch highlevel java rest api-----bboss
bboss elasticsearch是一套基于query dsl语法操作和访问分布式搜索引擎elasticsearch的o/r
我正在寻找一个内联网搜索引擎,它能够支持我们的内部网站点和网络共享,如SMB,NFS和可选的AFP. 对我们来说更好的是一个搜索引擎,它可以通过Mac OS X上的Spotlight框架等插件进行扩展. 有人知道这样的事吗?到目前为止……
今年9月,刚年满“10岁”的Google已经拥有全球最强大的计算机网络,其搜索引擎存储着超过400亿互联网网页。Google一词早已作为搜索引擎的代名词,融入了网民的日常生活,当近一半的英国人患上了“Google依赖症”时,……
本文转载自微信公众号:IEEE中国 工欲善其事必先利其器,没有合适的工具和充足的准备工作,再优秀的工匠也很难做出完美的作品。学术研究也是如此,要进行严谨的科学研究,我们需要对相关文献有充分了解。我们研究的难……
我有Rails应用程序,从每个请求记录一个IP地址到特定的URL,但在我的IP数据库中,我发现Facebook blok IP像66.220.15.*和Google IP(我建议它来自机器人).是否有任何公式来确定IP请求是由机器人还是搜索引擎蜘蛛?谢谢 机……
磁盘文件搜索是一件比较简单的事情,但很多代码写得非常繁琐,而且不支持多重路径和文件通配符,为此,我用VB写了一个通用的磁盘文件搜索引擎类,类代码如下: Option Explicit
'* *********************……
有没有办法从搜索引擎抓取中排除控制器操作?是否有MVC动词(属性),可以添加到动作名称上方? 我想从搜索引擎抓取中排除以下网址 Home/Secret?type=1 但我希望这可用于搜索引擎抓取 Home/Search 我认为您需要动态生成……
对于以技术为核心的技术博客来说,人们是冲着他们需要的内容去的,绝大多数情况下都不是在闲逛。如果你的网站里没有他想要的东西的话,他便会离开,人们是出于目的去搜索,基于动机,而不是无聊的在闲逛。无聊的话,……
bigdata platform and engine spark hadoop tez apex-core apex-malhar streaming spark-streaming flink strom mq kafka nosql hbase hive cassandra phoenix kudu resource manager mesos yarn index solr elastic
射手影音播放器——高清时代必备的美剧播放利器,除了轻巧的体积和易用的操作,最大的亮点莫过于可以通过射手网智能匹配下载字幕。不知出于何种考虑,在新版的射手影音中取消了很多高级设置,比如修改字幕保存路径的……
Yioop! 是一个 PHP 的搜索引擎,可用于 Web 的一般用途搜索,或者可提供URL搜索以及各种文档的索引搜索,包括:HTML, PDF, DOC, PPT, RTF, RSS, XML, SVG, PNG, JPG, BMP, GIF, 以及 sitemaps. 如果报这个错 : SQLi……
一、企业信息化: 1、ERP产品 2、CRM产品 3、物流 4、商务协同(CC)、知识管理(KM)与办公自动化(OA) 5、IT服务管理、IT外包 6、SAP 7、SCM 二、移动与游戏开发 1、移动计算技术、多核计算技术 2、Palm OS 3、手……
很早就想写一系列的这样的文章了,之前在一个电商公司做搜索,对搜索引擎有一些认识,来到一个新的创业公司以后非常高兴还有机会继续做这方面的事情,虽然领域已经变了,而且不是做搜索了,但是技术还是那些技术,并……
从零开始,写一个搜索引擎 (0x01) 第零部分我们已经列了一个提纲了,这一篇文章开始要详细说说了。 搜索引擎基本概念 在说搜索引擎架构分层之前,我们先确定几个搜索引擎的概念。 文档,搜索引擎的基本数据单元,比……
这一篇,我们来说说搜索引擎最核心的技术,倒排索引技术,倒排索引可能需要分成几篇文章才说得完,我们先会说说倒排索引的技术原理,然后会讲讲怎么用一些数据结构和算法来实现一个倒排索引,然后会说一个索引器怎么……
这一篇,我们来说说搜索引擎最核心的技术,倒排索引技术,倒排索引可能需要分成几篇文章才说得完,我们先会说说倒排索引的技术原理,然后会讲讲怎么用一些数据结构和算法来实现一个倒排索引,然后会说一个索引器怎么……
前面已经说了倒排索引的基本原理了,原理非常简单,也很好理解,关键是如何设计第二个倒排表,倒排表的第二列也很好设计,第一列就是关键了,为了满足快速查找的性能,设计第一列的结构,我们需要满足以下两个条件。……
本篇较长较枯燥,请保持耐心看完。 前面两章介绍了一下倒排索引以及倒排索引字典的两种存储结构,分别是跳跃表和哈希表,本篇我们介绍另一种数据结构,他也被大量使用在信息检索领域,我在github上实现的搜索引擎的词……
上面我们已经说过了一些倒排索引的东西,并且也知道了如何来实现一个倒排索引完成检索功能,那么检索完了以后如何排序呢,这一篇简单的说一下倒排索引的文本相关性排序,因为排序实在是太复杂了,我们这里就说说文本……
不知不觉写到第七篇了,按这个节奏,估计得写到15到20篇左右才能写完,希望自己能坚持下去,之前写代码的时候很多东西并没有想得那么细致,现在每写一篇文章还要查一些资料,确保文章的准确性,也相当于自己复习了一……