全文搜索引擎就是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户。今天给大家分享10款开源的全文搜索引擎,快收藏起来吧~
1.Apache Lucene Java 全文搜索框架
许可证:Apache-2.0开发语言:Java官网:https://lucene.apache.org/
Apache Lucene 是完全用 Java 编写的高性能、功能齐全的全文检索引擎架构,提供了完整的查询引擎和索引引擎、部分文本分析引擎。目的是为软件开发人员提供一个简单易用的工具包,以方便地在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。
项目地址:https://www.oschina.net/p/lucene
2.Apache Solr 全文搜索服务器
许可证:Apache-2.0开发语言:Java官网:https://solr.apache.org/
Apache Solr 是基于 Lucene 的全文搜索服务器,也是最流行的企业级搜索引擎,其主要功能包括全文检索、命中高亮、分面搜索、动态聚类、数据库集成,以及对富文本(如 Word、PDF)的处理。Solr 高度可扩展,并提供了分布式搜索和索引复制,Solr 4 还增加了 NoSQL 支持。
项目地址:https://www.oschina.net/p/solr
3.Nutch 搜索引擎
许可证:Apache-2.0开发语言:Java官网:https://nutch.apache.org/
Nutch 是一个开源 Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和 Web 爬虫。
Nutch 的创始人是 Doug Cutting,他同时也是 Lucene、Hadoop 和 Avro 开源项目的创始人。
项目地址:https://www.oschina.net/p/nutch
4.RediSearch 高性能全文搜索引擎
许可证:AGPL开发语言:C/C++官网:https://redis.io/docs/stack/search/
RediSearch 是一个高性能的全文搜索引擎,可作为一个 Redis Module 运行在 Redis 上,是由 RedisLabs 团队开发的。实现了Redis的查询、二级索引和全文搜索。这些功能在文本查询的基础上实现了多字段查询、聚合、精确短语匹配、数字过滤、地理过滤和矢量相似性语义搜索。
项目地址:https://www.oschina.net/p/redisearch
5.Xapian C++检索引擎
许可证:GPL开发语言:C/C++官网:https://xapian.org/
Xapian 是一个用 C++ 编写的全文检索程序,他的作用类似于 Java 的 lucene。尽管在 Java 世界 lucene 已经是标准的全文检索程序,但是 C/C++ 世界并没有相应的工具,而 Xapian 则填补了这个缺憾。
Xapian 是一个高度适应性的工具包,它允许开发人员轻松地将高级索引和搜索工具添加到他们自己的应用程序中。它内置支持多个权重模型系列,还支持一组丰富的布尔查询运算符。
项目地址:https://www.oschina.net/p/xapian
6.Manticore Search C++ 开发的高性能搜索引擎
许可证:GPL-2.0开发语言:C/C++官网:https://manticoresearch.com/
Manticore Search 是一个使用 C++ 开发的高性能搜索引擎,创建于 2017 年,其前身是 Sphinx Search 。Manticore Search 充分利用了 Sphinx,显着改进了它的功能,修复了数百个错误,几乎完全重写了代码并保持开源!这一切使 Manticore Search 成为一个现代,快速,轻量级和功能齐全的数据库,具有出色的全文搜索功能。
来自 MS 官方的测试表明 Manticore Search 性能比 ElasticSearch 有很大的提升。
项目地址:https://www.oschina.net/p/manticoresearch
7.Tantivy 全文搜索引擎库
许可证:MIT开发语言:Rust
Tantivy 是一个用 Rust 编写的搜索引擎库,其灵感来自于 Lucene。得益于 Rust 语言加持,Tantivy 性能比 Lucene 要好得多。
项目地址:https://www.oschina.net/p/tantivy
领取专属 10元无门槛券
私享最新 技术干货