开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

全文搜索引擎的比较 - Lucene,Sphinx,Postgresql,MySQL？

在云计算领域，全文搜索引擎是一种非常常用的工具，用于检索和搜索大量的文本数据。全文搜索引擎的主要比较包括：

Lucene：Lucene是一个基于Java的开源全文搜索引擎库，被广泛应用于搜索引擎应用中。它提供了丰富的API和工具，可以方便地实现索引、搜索、排序等功能。Lucene具有高可扩展性、高性能、高可用性等特点。
Sphinx：Sphinx是一个基于PHP的开源全文搜索引擎库，被广泛用于构建高并发、高可用性的搜索引擎应用。Sphinx具有高效、稳定、可扩展等特点，支持分布式搜索和索引分片等功能。
Postgresql：Postgresql是一个基于PostgreSQL的开源全文搜索引擎库，被广泛用于构建高并发、高可用性的搜索引擎应用。Postgresql具有高效、稳定、可扩展等特点，支持全文搜索、模糊搜索、短语搜索等功能。
MySQL：MySQL是一个基于MySQL的开源全文搜索引擎库，被广泛用于构建高并发、高可用性的搜索引擎应用。MySQL具有高效、稳定、可扩展等特点，支持全文搜索、模糊搜索、短语搜索等功能。

总的来说，全文搜索引擎是云计算领域中非常重要的一部分，它可以帮助开发者快速地检索和搜索大量的文本数据，提高数据的使用效率。在云计算领域，选择合适的全文搜索引擎库是非常重要的。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

SQL反模式学习笔记17 全文搜索

SQL的一个基本原理（以及SQL所继承的关系原理）就是一列中的单个数据是原子性的。

01

Lucenu和Sphinx介绍

一、Lucene介绍 1、简介 Lucene 是apache软件基金会一个开放源代码的全文检索引擎工具包，是一个全文检索引擎的架构，提供了完整的查询引擎和索引引擎，部分文本分析引擎。Lucene的目的是为软件开发人员提供一个简单易用的工具包，以方便的在目标系统中实现全文检索的功能，或者是以此为基础建立起完整的全文检索引擎。 2、官网 http://lucene.apache.org/ 3、优点成熟的解决方案，有很多的成功案例。apache 顶级项目，正在持续快速的进步。基

06

搜索：ElasticSearch OR MySQL?

背景我们开发一般的企业级Web应用，其实从本质上来说，都是对数据的增删查改进行各个维度的包装。所以说，不管你的程序如何开发，基本上，都离不开数据本身。那么，在开发企业级应用的过程中，很多同学一定遇到过这样的困惑，当完成了应用程序的基本增删查改功能之后，用户会经常吐槽当下的查询功能并不能满足自己的查询需求。这是因为，通常情况下，我们基于传统的数据库进行开发，都是需要预先去进行各种方面的考虑，然后再开发相应的查询语句。与其说是查询语句，不如说是数据过滤语句。这种时候，一个全能的搜索引擎就非常有必要了，通常我们

01

搜索引擎技术之概要预览

近些天在学校静心复习功课与梳理思路（找工作的事情暂缓），趁闲暇之际，常看有关搜索引擎相关技术类的文章，接触到不少此前未曾触碰到的诸多概念与技术，如爬虫，网页抓取，分词，索引，查询，排序等等，更惊叹于每一幅精彩的架构图，特此，便有记录下来的冲动，以作备忘。

03

Ubuntu系统，搭建mysql+sphinx环建

本文介绍下如何在ubuntu系统中，利用apt工具，搭建mysql+sphinx的全文检索环境。

02

Sphinx + Coreseek 实现中文分词搜索

全文检索是数据库的有力补充，全文检索并不能替代数据库在应用系统中的作用。当应用系统的数据以大量的文本信息为主时，採用全文检索技术能够极大的提升应用系统的价值。

02

【ES三周年】ElasticSearch数据库简单介绍

ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎，基于RESTful web接口。Elasticsearch是用Java开发的，并作为Apache许可条款下的开放源码发布，是当前流行的企业级搜索引擎。

08

ElasticSearch数据库（ES数据库）简介

**ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎，基于RESTful web接口。**Elasticsearch是用Java开发的，并作为Apache许可条款下的开放源码发布，是当前流行的企业级搜索引擎。

03

【迅搜02】究竟什么是搜索引擎？正式介绍XunSearch

啥？还要单独讲一下啥是搜索引擎？不就是百度、Google嘛，这玩意天天用，还轮的到你来说？

04

一款比 Elasticsearch 更快、更强劲的轻量级搜索引擎！我的天，这也太牛逼了吧

10倍提升效率，号称取代 Elasticsearch 的轻量级搜索引擎到底有多强悍？

04

全文搜索引擎 Elasticsearch 还是 Solr？

最近项目组安排了一个任务，项目中用到了基于 Solr 的全文搜索，但是该 Solr 搜索云项目不稳定，经常查询不出来数据，需要手动全量同步。

02

全文搜索引擎选ElasticSearch还是Solr？

而且它还是其他团队在维护，依赖性太强，导致 Solr 服务一出问题，我们的项目也基本瘫痪，因为所有的依赖查询都无结果数据了。

01

全文搜索引擎选ElasticSearch还是Solr？

最近项目组安排了一个任务，项目中用到了全文搜索，基于全文搜索 Solr，但是该 Solr 搜索云项目不稳定，经常查询不出来数据，需要手动全量同步，而且是其他团队在维护，依赖性太强，导致 Solr 服务一出问题，我们的项目也基本瘫痪，因为所有的依赖查询都无结果数据了。所以考虑开发一个适配层，如果 Solr 搜索出问题，自动切换到新的搜索--ES。

00

ElasticSearch和Solr，你还傻傻分不清楚吗？

最近项目组安排了一个任务，项目中用到了基于 Solr 的全文搜索，但是该 Solr 搜索云项目不稳定，经常查询不出来数据，需要手动全量同步。

04

【Rust日报】2022-07-04 使用 Diesel 和 PostgreSQL 创建 Rust API

本教程使用 Diesel 和 PostgreSQL 建立一个Rust应用程序, 内容包括:

02

elasticSearch学习(一)

Elaticsearch，简称为es， es是一个开源的高扩展的分布式全文检索引擎，它可以近乎实时的存储、检索数据;本身扩展性很好，可以扩展到上百台服务器，处理PB级别(大数据时代)的数据。es也使用 Java开发并使用Lucene作为其核心来实现所有索引和搜索的功能，但是它的目的是通过简单的RESTful API来隐藏Lucene的复杂性，从而让全文搜索变得简单。

01

全文搜索引擎选 ElasticSearch 还是 Solr？

最近项目组安排了一个任务，项目中用到了基于 Solr 的全文搜索，但是该 Solr 搜索云项目不稳定，经常查询不出来数据，需要手动全量同步。

01

9个基于Java的搜索引擎框架转

在这个信息相当繁杂的互联网时代，我们已经学会了如何利用搜索引擎这个强大的利器来找寻目标信息，比如你会在Google上搜索情人节如何讨女朋友欢心，你也会在百度上寻找正规的整容医疗机构（尽管有很大一部分广告骗子）。那么如果在你自己开发的网站系统中需要能让用户搜索一些重要的信息，并且能以结构化的结果展现给用户，下面分享的这9款Java搜索引擎框架或许就可以帮助到你了。

04

全文搜索引擎选 ElasticSearch 还是 Solr？

最近项目组安排了一个任务，项目中用到了基于 Solr 的全文搜索，但是该 Solr 搜索云项目不稳定，经常查询不出来数据，需要手动全量同步。

02

全文搜索，ElasticSearch和Solr哪个更好用？

原文链接www.cnblogs.com/jajian/p/9801154.html 前言最近项目组安排了一个任务，项目中用到了基于 Solr 的全文搜索，但是该 Solr 搜索云项目不稳定，经常查询不出来数据，需要手动全量同步。而且它还是其他团队在维护，依赖性太强，导致 Solr 服务一出问题，我们的项目也基本瘫痪，因为所有的依赖查询都无结果数据了。所以考虑开发一个适配层，如果 Solr 搜索出问题，自动切换到新的搜索 ES。其实可以通过 Solr 集群或者服务容错等设计来解决该问题。但是先不考虑本

02

全文搜索引擎选ElasticSearch还是Solr？

最近项目组安排了一个任务，项目中用到了基于 Solr 的全文搜索，但是该 Solr 搜索云项目不稳定，经常查询不出来数据，需要手动全量同步。

01

搜索引擎选 ElasticSearch 还是 Solr？

最近项目组安排了一个任务，项目中用到了基于 Solr 的全文搜索，但是Solr 搜索云项目不稳定，经常查询不出来数据，需要手动全量同步。

04

Elasticsearch 全文搜索引擎理解和基本操作

ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎，基于RESTful web接口。

03

Hi，Java工程师：关于全文搜索引擎，这篇文章不得不看！

最近项目组安排了一个任务，项目中用到了基于 Solr 的全文搜索，但是该 Solr 搜索云项目不稳定，经常查询不出来数据，需要手动全量同步。

03

Sphinx 全文搜索引擎

Sphinx是一个基于SQL的全文检索引擎，可以结合MySQL,PostgreSQL做全文搜索，它可以提供比数据库本身更专业的搜索功能，使得应用程序更容易实现专业化的全文检索。

01

搜索引擎solr和elasticsearch

搜索引擎（Search Engine）是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息，在对信息进行组织和处理后，为用户提供检索服务，将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。

03

怎么会是lucene?

在好朋友lhelper的帮助下，开始学习全文搜索引擎lucene了。从网上搜索了一些全文搜索的资料后发现这方面的产品很多，光是在http://www.searchtools.com 上你可以查到100多个搜索的工具（包括源代码）。如果你在百度上以“全文搜索”为关键字搜索的话，会发现除了理论上的介绍以外，大部分的实例都是来自lucene。为什么只有lucene这么广为接受呢？

03

10倍提升效率，号称取代 Elasticsearch 的轻量级搜索引擎到底有多强悍？

Manticore Search 是一个使用 C++ 开发的高性能搜索引擎，创建于 2017 年，其前身是 Sphinx Search 。Manticore Search 充分利用了 Sphinx，显着改进了它的功能，修复了数百个错误，几乎完全重写了代码并保持开源。这一切使 Manticore Search 成为一个现代，快速，轻量级和功能齐全的数据库，具有出色的全文搜索功能。

04

10倍提升效率，要取代 Elasticsearch，到底有多强悍？

Manticore Search 是一个使用 C++ 开发的高性能搜索引擎，创建于 2017 年，其前身是 Sphinx Search 。

04

新一代搜索引擎，据说是ES的15倍？

Manticore Search 是一个使用 C++ 开发的高性能搜索引擎，创建于 2017 年，其前身是 Sphinx Search 。Manticore Search 充分利用了 Sphinx，显着改进了它的功能，修复了数百个错误，几乎完全重写了代码并保持开源。这一切使 Manticore Search 成为一个现代，快速，轻量级和功能齐全的数据库，具有出色的全文搜索功能。

02

搜索引擎选择 Elasticsearch与Solr

一、Elasticsearch简介 Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。它可以用于全文搜索，结构化搜索以及分析，当然你也可以将这三者进行组合。Elasticsearch是一个建立在全文搜索引擎 Apache Lucene™ 基础上的搜索引擎，可以说Lucene是当今最先进，最高效的全功能开源搜索引擎框架。但是Lucene只是一个框架，要充分利用它的功能，需要使用JAVA，并且在程序中集成Lucene。需要很多的学习了解，才能明白它是如何运行的，Lucene确实非常复杂。Elasticsearch使用Lucene作为内部引擎，但是在使用它做全文搜索时，只需要使用统一开发好的API即可，而不需要了解其背后复杂的Lucene的运行原理。当然Elasticsearch并不仅仅是Lucene这么简单，它不但包括了全文搜索功能，还可以进行以下工作: (1)分布式实时文件存储，并将每一个字段都编入索引，使其可以被搜索。 (2)实时分析的分布式搜索引擎。 (3)可以扩展到上百台服务器，处理PB级别的结构化或非结构化数据。Elasticsearch的优缺点: 优点 Elasticsearch是分布式的。不需要其他组件，分发是实时的，被叫做”Push replication”。 Elasticsearch 完全支持 Apache Lucene 的接近实时的搜索。处理多租户（multitenancy）不需要特殊配置，而Solr则需要更多的高级设置。 Elasticsearch 采用 Gateway 的概念，使得完备份更加简单。各节点组成对等的网络结构，某些节点出现故障时会自动分配其他节点代替其进行工作。缺点只有一名开发者（当前Elasticsearch GitHub组织已经不只如此，已经有了相当活跃的维护者）还不够自动（不适合当前新的Index Warmup API）二、Solr简介 Solr（读作“solar”）是Apache Lucene项目的开源企业搜索平台。其主要功能包括全文检索、命中标示、分面搜索、动态聚类、数据库集成，以及富文本（如Word、PDF）的处理。Solr是高度可扩展的，并提供了分布式搜索和索引复制。Solr是最流行的企业级搜索引擎，Solr4 还增加了NoSQL支持。 Solr是用Java编写、运行在Servlet容器（如 Apache Tomcat 或Jetty）的一个独立的全文搜索服务器。Solr采用了 Lucene Java 搜索库为核心的全文索引和搜索，并具有类似REST的HTTP/XML和JSON的API。Solr强大的外部配置功能使得无需进行Java编码，便可对其进行调整以适应多种类型的应用程序。Solr有一个插件架构，以支持更多的高级定制。 Solr的优缺点优点 Solr有一个更大、更成熟的用户、开发和贡献者社区。支持添加多种格式的索引，如：HTML、PDF、微软 Office 系列软件格式以及 JSON、XML、CSV 等纯文本格式。 Solr比较成熟、稳定。不考虑建索引的同时进行搜索，速度更快。缺点建立索引时，搜索效率下降，实时索引搜索效率不高。三、Elasticsearch与Solr的比较当单纯的对已有数据进行搜索时，Solr更快。

01

php_sphinx安装使用

Sphinx的使用背景：在mysql中优化的时候，对varchar,char,text对这些数据进行查询时，如果我们使用like ‘%单词’，是无法使用到索引，如果网站的数据量比较大，会拖垮网站的速度。

02

【全文检索_01】核心理论

全文检索是 20世纪末产生的一种新的信息检索技术。经过几十年的发展，特别是以计算机技术为代表的新一代信息技术应用，使全文检索从最初的字符串匹配和简单的布尔逻辑检索技术演进到能对超大文本、语音、图像、活动影像等非结构化数据进行综合管理的复合技术。由于内涵和外延的深刻变化，全文检索系统已成为新一代管理系统的代名词，衡量全文检索系统的基本指标和全文检索的内涵也发生巨大变化。

02

号称取代 Elasticsearch，太猛了！

Manticore Search 是一个使用 C++ 开发的高性能搜索引擎，创建于 2017 年，其前身是 Sphinx Search 。

04

搜索引擎

在现在互联网如日中天的时代，即使你不是互联网行业的人，你也一定会用过谷歌或者百度。因为他们已经影响了我们生活的方方面面，为我们提供了很多的便利。那么在互联网行业的人我们除了使用它们，我们还迫切地想知道它们到底是怎么实现的。

01

ElasticSearch(7.2.2)-常用的搜索引擎

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

01

ElasticSearch 概述

The Elastic Stack, 包括 Elasticsearch、Kibana、Beats 和 Logstash（也称为 ELK Stack）。能够安全可靠地获取任何来源、任何格式的数据，然后实时地对数据进行搜索、分析和可视化。Elaticsearch，简称为 ES，ES 是一个开源的高扩展的分布式全文搜索引擎，是整个 Elastic Stack 技术栈的核心。它可以近乎实时的存储、检索数据；本身扩展性很好，可以扩展到上百台服务器，处理 PB 级别的数据。

01

Elasticsearch 概述

Google，百度类的网站搜索，它们都是根据网页中的关键字生成索引，我们在搜索的时候输入关键字，它们会将该关键字即索引匹配到的所有网页返回；还有常见的项目中应用日志的搜索等等。对于这些非结构化的数据文本，关系型数据库搜索不是能很好的支持。一般传统数据库，全文检索都实现的很鸡肋，因为一般也没人用数据库存文本字段。进行全文检索需要扫描整个表，如果数据量大的话即使对 SQL 的语法优化，也收效甚微。建立了索引，但是维护起来也很麻烦，对于 insert 和 update 操作都会重新构建索引。基于以上原因可以分析得出，在一些生产环境中，使用常规的搜索方式，性能是非常差的：

01

科普向 | Lucene，Solr，Elasticsearch之间的区别和联系

最近有幸研究到了这块领域的内容，而我本人也对于这块非常的感兴趣，所以打算写一篇文章记录一下…

01

纯 MongoDB 实现中文全文搜索

MongoDB在2.4版中引入全文索引后几经迭代更新已经比较完美地支持以空格分隔的西语，但一直不支持中日韩等语言，社区版用户不得不通过挂接ElasticSearch等支持中文全文搜索的数据库来实现业务需求，由此引入了许多业务限制、安全问题、性能问题和技术复杂性。作者独辟蹊径，基于纯MongoDB社区版（v4.x和v5.0）实现中文全文搜索，在接近四千万个记录的商品表搜索商品名，检索时间在200ms以内，并使用Change Streams技术同步数据变化，满足了业务需要和用户体验需求。

02

面试官赞不绝口的回答！请谈谈对ES的理解

最近有粉丝私信我说，希望我能出一期关于ES的文章。所以今天，我就给大家分享一下我对ES的理解。

04

后端技术杂谈4：Elasticsearch与solr入门实践

本系列文章将整理到我在GitHub上的《Java面试指南》仓库，更多精彩内容请到我的仓库里查看

01

Elasticsearch从零开始

作为最受欢迎和最有活力的全文搜索引擎系统，ElasticSearch有着你无法拒绝的魅力，可以方便快速地集成到项目中储存、搜索和分析海量数据。本文我们从零开始上手来体验学习一下ElasticSearch。

01

Elasticsearch探索实践（一）「建议收藏」

由于Elasticsearch的功能强大和使用简单，维基百科、卫报、Stack Overflow、GitHub等都纷纷采用它来做搜索。现在，Elasticsearch已成为全文搜索领域的主流软件之一。

02

不选择使用Lucene的6大原因

Lucene是开放源代码的全文搜索引擎工具包，凭借着其强劲的搜索功能和简单易用的实现，在国内已经很普及，甚至一度出现了言搜索必称Lucene的盛景。上个月Lucene的开发团队发布了 Java Lucene 2.3.1 ，相信很多朋友们都用上了。在国内对Lucene的介绍可以分为3块儿：第一类是：以车东的Lucene：基于Java的全文检索引擎简介为代表的基础入门介绍；第二类是Lucene倒排索引原理和Lucene软件包、实现类的介绍；第三类是以中文分词为中心的介绍；任何一个软件，包括所有伟大的软件都有这样或者那样的“缺点”和各自适用的领域，Lucene也不例外。在国内对Lucene这个软件包的批评，似乎没有看到过。可能大家都忙于做项目，纵然Lucene有再大的缺陷，凭借着Lucene良好的口碑，也不会说上一句不是。今天在阅读LingWay （一个做垂直的语义搜索引擎）的CTO Cedric Champeau 先生的博客是发现有一篇题为：Why lucene isn't that good 为什么Lucene并不是想象的那么棒的文章：Champeau 开门见山指出了Lucene的6大不足之处，鉴于 Lingway 公司使用Lucene已有好几年的历史，我相信Cedric Champeau的对Lucene的评论还是值得一读。不选择使用Lucene的6大原因： 6、Lucene 的内建不支持群集。 Lucene是作为嵌入式的工具包的形式出现的，在核心代码上没有提供对群集的支持。实现对Lucene的群集有三种方式：1、继承实现一个 Directory；2、使用Solr 3、使用 Nutch+Hadoop；使用Solr你不得不用他的Index Server ，而使用Nutch你又不得不集成抓取的模块； 5、区间范围搜索速度非常缓慢； Lucene的区间范围搜索，不是一开始就提供的是后来才加上的。对于在单个文档中term出现比较多的情况，搜索速度会变得很慢。因此作者称Lucene是一个高效的全文搜索引擎，其高效仅限于提供基本布尔查询 boolean queries； 4、排序算法的实现不是可插拔的，因为贯穿Lucene的排序算法的tf/idf 的实现，尽管term是可以设置boost或者扩展Lucene的Query类，但是对于复杂的排序算法定制还是有很大的局限性； 3、Lucene的结构设计不好； Lucene的OO设计的非常糟，尽管有包package和类class，但是Lucene的设计基本上没有设计模式的身影。这是不是c或者c++程序员写java程序的通病？ A、Lucene中没有使用接口Interface，比如Query 类( BooleanQuery, SpanQuery, TermQuery...) 大都是从超类中继承下来的； B、Lucene的迭代实现不自然：没有hasNext() 方法, next() 返回一个布尔值 boolean然后刷新对象的上下文； 2、封闭设计的API使得扩展Lucene变得很困难；参考第3点； 1、Lucene的搜索算法不适用于网格计算；详情可以查看：Cedric Champeau 先生的博客：Why lucene isn't that good 为什么Lucene并不是想象的那么棒

02

1.Elasticsearch简介

本系列文章参考地址： - https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html - https://www.elastic.co/guide/cn/elasticsearch/guide/current/index.html - Elasticsearch: The Definitive Guide by Clinton Gormley and Zachary Tong (O’Reilly). Copyright 2015 Elasticsearch BV, 978-1-449-35854-9。

03

一步一步学lucene——（第一步：概念篇）

信息检索的概念信息检索（Information Retrieval）是指信息按一定的方式组织起来，并根据信息用户的需要找出有关的信息的过程和技术。狭义的信息检索就是信息检索过程的后半部分，即从信息集合中找出所需要的信息的过程，也就是我们常说的信息查寻（Information Search 或Information Seek）。我们在下边研究的lucene就是对信息做全文检索的一种手段，或者说是一项比较流行的技术，跟google、baidu等专业的搜索引擎比起来会有一定的差距，但是对于普通的企业级应用已

08

如何在CentOS 7上安装和配置Sphinx

Sphinx是一个开源搜索引擎，允许全文搜索。众所周知，它能非常有效地对大数据进行搜索。要编制索引的数据通常来自非常不同的来源：SQL数据库，纯文本文件，HTML文件，邮箱等。

02

内存吞金兽(Elasticsearch)的那些事儿 -- 认识一下

ES 本质上是一个支持全文搜索的分布式内存数据库，特别适合用于构建搜索系统。ES 之所以能有非常好的全文搜索性能，最重要的原因就是采用了倒排索引。倒排索引是一种特别为搜索而设计的索引结构，倒排索引先对需要索引的字段进行分词，然后以分词为索引组成一个查找树，这样就把一个全文匹配的查找转换成了对树的查找，这是倒排索引能够快速进行搜索的根本原因。

01

ElasticSerach

Elasticsearch是一个基于Apache Lucene(TM)的开源搜索引擎，无论在开源还是专有领域，Lucene可以被认为是迄今为止最先进、性能最好的、功能最全的搜索引擎库。但是，Lucene只是一个库。想要发挥其强大的作用，你需使用Java并要将其集成到你的应用中。Lucene非常复杂，你需要深入的了解检索相关知识来理解它是如何工作的。 Elasticsearch也是使用Java编写并使用Lucene来建立索引并实现搜索功能，但是它的目的是通过简单连贯的RESTful API让全文搜索变得简单并隐藏Lucene的复杂性。 Elasticsearch不仅仅是Lucene和全文搜索引擎，它还提供：

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭