首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Elasticsearch(ES)索引生命周期管理 (Index Lifecycle Management, ILM)

Elasticsearch(ES)索引生命周期管理 (Index Lifecycle Management, ILM)

作者头像
运维小路
发布2025-09-30 15:30:36
发布2025-09-30 15:30:36
12000
代码可运行
举报
文章被收录于专栏:运维小路运维小路
运行总次数:0
代码可运行

作者介绍:简历上没有一个精通的运维工程师,下面的思维导图也是预计更新的内容和当前进度(不定时更新)。

中间件,我给它的定义就是为了实现某系业务功能依赖的软件,包括如下部分:

Web服务器

代理服务器

ZooKeeper

Kafka

RabbitMQ

Hadoop HDFS

Elasticsearch ES (本章节)

前面我们介绍模板的时候有提到过我们会在ES生成大量的索引,但是我们不能光生成索引,不考虑释放的问题,所以我们 就引入今天的概念:索引生命周期管理 (Index Lifecycle Management, ILM)。

Elasticsearch 的 索引生命周期管理 (Index Lifecycle Management, ILM) 是自动化管理索引生命周期的核心功能,尤其适用于时序数据(如日志、指标)。它通过预定义的策略(Policy)自动控制索引从创建到删除的完整过程,大幅降低运维成本。下面我们用一个监控的案例来解释这个问题。

需求

监控数据,最小单位是每10秒采集一次数据,每小时生成一个索引,只能查最近24小时的数据。并且一次最多只能查一个小时的数据。

然后把前面每10秒的数据合并每分钟数据,每天一个索引,可以查询最近七天的数据,一次查询只能查询最近一天的数据。

然后再把前面每分钟的数据合并成每小时的数据,每天一个索引,然后最多可以查一个月的数据,一次最多多查七天数据。

整体架构设计

技术实现

1.原始数据策略(10秒粒度)

索引模式: raw-metrics-<yyyy.MM.dd-HH> 保留时间: 24小时 查询限制: 最多查询1小时数据

代码语言:javascript
代码运行次数:0
运行
复制
# 创建 ILM 策略
PUT _ilm/policy/raw_metrics_policy
{
  "policy": {
    "phases": {
      "hot": {
        "min_age": "0ms",
        "actions": {
          "rollover": {
            "max_age": "1h"
          },
          "set_priority": {
            "priority": 100
          }
        }
      },
      "delete": {
        "min_age": "24h",
        "actions": {
          "delete": {}
        }
      }
    }
  }
}

# 创建索引模板
PUT _index_template/raw_metrics_template
{
  "index_patterns": ["raw-metrics-*"],
  "template": {
    "settings": {
      "number_of_shards": 1,
      "number_of_replicas": 1,
      "index.lifecycle.name": "raw_metrics_policy"
    },
    "aliases": {
      "raw_metrics": {}
    }
  }
}

# 创建初始索引
PUT raw-metrics-2024.05.01-00
{
  "aliases": {
    "raw_metrics_write": {
      "is_write_index": true
    }
  }
}

2. 分钟级聚合策略(1分钟粒度

索引模式: minute-metrics-<yyyy.MM.dd> 保留时间: 7天 查询限制: 最多查询1天数据

代码语言:javascript
代码运行次数:0
运行
复制
# 创建 Rollup 任务(每分钟聚合)
PUT _rollup/job/minute_metrics_rollup
{
  "index_pattern": "raw-metrics-*",
  "rollup_index": "minute-metrics-<{now/d}>",
  "cron": "0 */5 * * * ?",  // 每5分钟运行一次
  "groups": {
    "date_histogram": {
      "field": "@timestamp",
      "fixed_interval": "1m"
    }
  },
  "metrics": [
    {"field": "cpu", "metrics": ["avg", "max", "min"]},
    {"field": "memory", "metrics": ["avg"]}
  ]
}

# 创建 ILM 策略
PUT _ilm/policy/minute_metrics_policy
{
  "policy": {
    "phases": {
      "hot": {
        "min_age": "0ms",
        "actions": {
          "set_priority": {
            "priority": 50
          }
        }
      },
      "delete": {
        "min_age": "7d",
        "actions": {
          "delete": {}
        }
      }
    }
  }
}

# 创建索引模板
PUT _index_template/minute_metrics_template
{
  "index_patterns": ["minute-metrics-*"],
  "template": {
    "settings": {
      "number_of_shards": 1,
      "number_of_replicas": 1,
      "index.lifecycle.name": "minute_metrics_policy"
    },
    "aliases": {
      "minute_metrics": {}
    }
  }
}

3. 小时级聚合策略(1小时粒度)

索引模式: hour-metrics-<yyyy.MM.dd> 保留时间: 30天 查询限制: 最多查询7天数据

代码语言:javascript
代码运行次数:0
运行
复制
# 创建 Rollup 任务(每小时聚合)
PUT _rollup/job/hour_metrics_rollup
{
  "index_pattern": "minute-metrics-*",
  "rollup_index": "hour-metrics-<{now/d}>",
  "cron": "0 0 */1 * * ?",  // 每小时运行一次
  "groups": {
    "date_histogram": {
      "field": "@timestamp",
      "fixed_interval": "1h"
    }
  },
  "metrics": [
    {"field": "cpu.avg", "metrics": ["avg"]},
    {"field": "cpu.max", "metrics": ["max"]}
  ]
}

# 创建 ILM 策略
PUT _ilm/policy/hour_metrics_policy
{
  "policy": {
    "phases": {
      "hot": {
        "min_age": "0ms",
        "actions": {
          "set_priority": {
            "priority": 25
          }
        }
      },
      "warm": {
        "min_age": "7d",
        "actions": {
          "force_merge": {
            "max_num_segments": 1
          }
        }
      },
      "delete": {
        "min_age": "30d",
        "actions": {
          "delete": {}
        }
      }
    }
  }
}

# 创建索引模板
PUT _index_template/hour_metrics_template
{
  "index_patterns": ["hour-metrics-*"],
  "template": {
    "settings": {
      "number_of_shards": 1,
      "number_of_replicas": 1,
      "index.lifecycle.name": "hour_metrics_policy"
    },
    "aliases": {
      "hour_metrics": {}
    }
  }
}

当然今天这个只是给大家一个讲解的基本的概念,由于这个实际操作需要比较多的时间,所以这里并没有实际案例,下个小节我们讲通过模拟实际数据来实现今天这个小节的逻辑。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-08-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 运维小路 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 2. 分钟级聚合策略(1分钟粒度)
  • 3. 小时级聚合策略(1小时粒度)
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档