首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Elasticsearch(ES)模块结构图

Elasticsearch(ES)模块结构图

作者头像
运维小路
发布2025-09-30 15:29:34
发布2025-09-30 15:29:34
620
举报
文章被收录于专栏:运维小路运维小路

作者介绍:简历上没有一个精通的运维工程师,下面的思维导图也是预计更新的内容和当前进度(不定时更新)。

中间件,我给它的定义就是为了实现某系业务功能依赖的软件,包括如下部分:

Web服务器

代理服务器

ZooKeeper

Kafka

RabbitMQ

Hadoop HDFS

Elasticsearch ES (本章节)

前面我们用了3个小节来介绍ES所涉及到底层技术:倒排索引,分词,Lucene,今天来贴一个整个架构图。

此图来源于网络,且该架构已经和当前的版本部分数据不一致,仅作理解。

第一层:交互层

RESTful Style API:提供 RESTful 风格接口,让用户 / 程序能通过 HTTP 方法(GET/POST 等)操作 Elasticsearch(如创建索引、查询数据 ),是开发者常用的交互入口。

Java(Netty):基于 Netty 实现 Java 层面的网络通信支持,保障高效请求处理与响应。

JMX:Java 管理扩展,用于监控、管理 Elasticsearch 的运行状态(如内存、线程等)。

3rd Plugins:第三方插件扩展层,可通过插件增强 Elasticsearch 功能(如自定义分词、集成其他系统 )。

第二层:传输层(Transport)

Thrift: 一种高效的、可扩展的跨语言服务开发框架。

Memcached: 一个高性能的分布式内存对象缓存系统,用于加速动态Web应用程序。

Http: 通过HTTP协议进行数据传输。

第三层:服务发现(Discovery)与脚本(Scripting)层

Discovery:负责集群节点发现,Zen 是 Elasticsearch 内置的默认发现机制,EC2 适配 AWS 环境,保障集群节点自动识别、组建集群。

Scripting:支持多种脚本语言(mvel、js、python 等 ),允许在查询、更新等操作中嵌入自定义逻辑(如复杂评分、数据处理 )

3rd Plugins :表明发现机制是可扩展的,可以通过插件实现自定义的发现策略(例如,基于 Consul, Kubernetes, GCE, Azure 等的发现插件)

第四层: 核心功能模块

Index Module:索引模块,负责索引的创建、删除、分片管理等,是数据写入 Elasticsearch 的基础流程。

Search Module:搜索模块,实现查询解析、执行、结果聚合等,支撑复杂搜索需求(如全文检索、过滤、排序 )。

Mapping:定义索引的 “数据结构 schema”,类似数据库表结构,指定字段类型(文本、数值等 )、分词规则等,保障数据正确存储与检索。

River:早期用于 “河流” 功能(已逐步废弃 ),曾支持从外部数据源(如数据库、消息队列 )持续拉取数据到 Elasticsearch 。

第五层:Distributed Lucene Directory

Distributed Lucene Directory: 使用Lucene作为底层搜索引擎,并将其分布化,以支持大规模的数据存储和检索。

底层:Gateway

Local FileSystem: 使用本地文件系统作为数据存储,也是一般情况下使用最多的文件系统。

Shared FileSystem: 使用共享文件系统,允许多个节点访问同一份数据。

Hadoop HDFS: 集成Hadoop的分布式文件系统(HDFS),适用于大数据场景。

Amazon S3: 支持将数据存储在Amazon S3云存储服务中。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-08-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 运维小路 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 第二层:传输层(Transport)
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档