Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >腾讯云ElasticSearch迁移场景介绍

腾讯云ElasticSearch迁移场景介绍

原创
作者头像
岳涛
修改于 2025-03-25 07:17:15
修改于 2025-03-25 07:17:15
4072
举报
文章被收录于专栏:大数据生态大数据生态

说明

本文描述问题及解决方法同样适用于 腾讯云 Elasticsearch Service(ES)

背景

腾讯云 Elasticsearch Service (ES) 凭借多年的运营经验和优质的线上服务,以其低成本、高性能、高可靠性和高扩展性的特点,已经成为越来越多客户的不二之选。那么,哪些场景可以迁移到腾讯云 ES?不同的场景应该使用什么方案?它们之间有什么差异?让我们在本文中一一展开。

ES 常见迁移场景

ES 迁移方案介绍

ES 标准迁移方案介绍

ES迁移主推Snapshot方案,如有其他特殊场景,可参考Logstash及在线融合方案。具体方案对比如下(方案超链接可点击):

迁移方案

适用场景

适用产品

停服割接时间

新增

更新

删除

清洗

方案实施

Snapshot

可接受短暂停服,对迁移速度有要求的场景

自建ESAWS/阿里/华为云ES

通过多次增量快照,保证大部分场景下停服时间<=20min

可以根据文档自助迁移

Logstash

源端版本>目标端时,或迁移过程中需要定制化改造的场景

自建/AWS云 Opensearch华为云 OpensearchAWS/阿里/华为云ES

在保证数据一致性的情况下,Logstash方案需全程停服,停服时间与集群资源性能、专线带宽等因素有关

可以根据文档自助迁移

在线融合(腾讯云ES特有)

在线不停服迁移

自建ES

无需停服

需腾讯云ES后台配合纯手工操作,有一定风险

ES 其他迁移方案介绍

其他服务 to es 迁移方案如下:

产品

迁移方案

方案链接

阿里云 Opensearch

使用Oceanus通过上游多表Join方式写入ES宽表

https://cloud.tencent.com/document/product/849/60520

Apache Solr

Solr to ES 开源工具自研工具Bi Fang(支持断点续传)

https://github.com/o19s/solr-to-es https://doc.weixin.qq.com/doc/w3_AfYAHgZKAMAtqHUOionQQGRhP9otU

Mysql

LogstashOceanus

https://cloud.tencent.com/document/product/845/55159 https://cloud.tencent.com/document/product/849/60520

Milvus

Milvusdm

https://github.com/milvus-io/milvus-tools

ES 迁移方案概览

Snapshot方案

使用Snapshot从自建ES迁移至腾讯云ES集群方案概览:

Logstash方案

使用Logstash迁移数据至腾讯云ES集群方案概览:

在线融合方案

使用在线融合迁移数据至腾讯云ES集群方案概览:

常见迁移问题案例

删除快照导致的业务异常

问题案例:

删除快照导致集群 shard lock。

说明:

快照在进行中时,删除快照的操作会非常重,可能会对集群稳定性造成影响。删除快照有如下问题:

  • 可能会引起索引 shard lock;
  • 快照在进行中时,DELETE 快照很大几率会超时或无法成功,只能通过重启集群解决;
  • 如已发起快照删除,在删除操作完成之前,无法发起新的快照请求

解决方案:

  • Reopen 索引,尝试脱离 shard lock 状态;
  • 如 reopen 无效,则需滚动重启对应节点。

避免方式:

在快照进行中时,应避免对快照做删除操作。如发生误备份的情况,也建议等备份结束再进行删除。

索引只读导致的业务全面不可写

问题案例:

源端索引 index block write / read only 属性备份后被携带到目标端。

说明:

如果是采用源端索引只读的方式停写,该索引属性会被同步到快照里,在恢复时也会携带禁写属性到目标端集群,所以在恢复后需要回滚禁写属性,否则会导致业务不可写。

解决方案:

数据在目标端恢复之后,使用 PUT settings 接口对目标端索引全量解除禁写。

规避方法:

最后一次增量前的切割操作,建议是业务主动停写。如只能通过禁写的方式停写,则务必需要在切割前对目标端集群执行一个解除禁写的操作。

索引滚动导致的迁移失败

问题案例:

在快照备份过程中,日志滚动属性发生变化。

说明:

在日志场景有 rollover 的情况下,如果 is_write_index 属性发生变化,则会发生恢复失败的问题,具体表现为日志里会抛异常:

代码语言:txt
AI代码解释
复制
Caused by: java.lang.IllegalStateException: alias [xxxxx] has more than one write index [xxxxx-2023.10.25-000001, xxxxx-2023.10.26-000002]

解决方案:

取消目标端索引旧的 is_write_index 属性:

代码语言:txt
AI代码解释
复制
POST_aliases
{
  "actions": [
    {
      "add": {
        "index": "xxxx-2023.10.25-000001",
        "alias": "xxxx",
        "is_write_index": false
      }
    }
  ]
}

规避方法:

  • 对于滚动频繁的场景,每次恢复前检查一下索引可写属性,避免冲突;
  • 在日志场景有 rollover 的情况下,建议业务切割上云之后,再同步 ILM(索引生命周期管理) 任务,否则会发生目标集群 ILM 提前触发 rollover 的可能,也会导致 is_write_index 属性冲突问题。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
2 条评论
热度
最新
迁移教程写的还是非常清晰的。
迁移教程写的还是非常清晰的。
111举报
谢谢大佬
谢谢大佬
回复回复1举报
推荐阅读
编辑精选文章
换一批
Elasticsearch 索引生命周期管理详解与实践汇总篇
Elasticsearch 从版本6.8开始已经免费开放索引生命周期管理的功能,通过该功能我们可以实现日志索引不同阶段的细化管理进而达到实际需求。本文基于以往的索引生命周期管理知识沉淀作进一步的深化,如大家想了解ILM的相关文章,请参考如下链接:
南非骆驼说大数据
2020/11/23
2.5K0
Elasticsearch 索引生命周期管理详解与实践汇总篇
​【腾讯云ES】自建ES集群在线融合迁移原理解析及操作指南
随着腾讯云ES集群稳定性越来越高、产品体验越来越好。有越来越多的外部客户希望将自建的ES集群迁移到腾讯云上来。本文将介绍一种腾讯云ES在业界独有的业务不停服无感知的迁移方案--在线融合迁移方案。本方案目前已经迁移了上百套客户自建ES集群上云。下面将结合我们在给客户迁移过程中总结出的宝贵经验,来详细介绍下在线融合迁移技术方案的基本原理、核心优势、迁移步骤和注意事项。
吴容
2022/12/09
2.5K0
​【腾讯云ES】自建ES集群在线融合迁移原理解析及操作指南
自建ES集群迁移至腾讯云ES的几种方案介绍
随着腾讯云Elasticsearch产品功能越来越丰富、产品体验越来越好。越来越多的客户将自建的ES集群或者部署在其他云厂商的 ES 集群迁移到腾讯云上来。为了更加方便快捷地帮助客户完成集群迁移工作,下面简单介绍下可提供的两种迁移方案,离线迁移和在线迁移。
吴容
2020/07/28
4.2K0
自建ES集群迁移至腾讯云ES的几种方案介绍
3种 Elasticsearch 数据离线迁移方案,你知道吗?
基于 COS 快照的迁移方式是使用 ES 的 snapshot api 接口进行迁移,基本原理就是从源 ES 集群创建索引快照,然后在目标 ES 集群中进行恢复。通过 snapshot 方式进行数据迁移时,特别需要注意 ES 的版本问题:
公众号: 云原生生态圈
2022/02/16
4K0
腾讯云Elasticsearch索引生命周期管理原理及实践
本文将从三个方面介绍Elasticsearch索引生命周期管理的特性,首先会介绍ES索引生命周期管理的基本原理,其次会通过一个常见的日志场景来一步步配置索引生命周期管理,最后向大家介绍在日常的ES运维工作中遇到的关于索引生命周期管理常见的问题及解决方法。
吴容
2021/12/04
4.4K0
腾讯云Elasticsearch索引生命周期管理原理及实践
腾讯云 Elasticsearch Service COS快照恢复常见问题及解决方案
用户在腾讯云上自建的 ES 集群或者在其它云厂商购买的 ES 集群,如果要迁移至腾讯云 ES(适用于大部分普通索引迁移),用户可以根据自己的业务需要选择合适的迁移方案。如果业务可以停服或者可以暂停写操作,可以使用以下几种方式进行数据迁移:
zjiekou
2023/12/06
1.1K0
腾讯云 Elasticsearch Service COS快照恢复常见问题及解决方案
Elasticsearch 数据离线迁移方案(含冷热分层场景)
本文描述问题及解决方法同样适用于 腾讯云 Elasticsearch Service(ES)。
岳涛
2023/06/13
3.3K0
Elasticsearch 数据离线迁移方案(含冷热分层场景)
Elasticsearch跨集群数据迁移之离线迁移
用户在腾讯云上自建的ES集群或者在其它云厂商购买的ES集群,如果要迁移至腾讯云ES,用户可以根据自己的业务需要选择适合自己的迁移方案。如果业务可以停服或者可以暂停写操作,可以参考离线迁移的四种方案。
bellen
2018/06/08
25.6K2
Elasticsearch跨集群数据迁移之离线迁移
Elasticsearch 可搜索快照技术原理及最佳实践
Elasticsearch于7.10版本推出可搜索快照功能,但是7.10版本的可搜索快照技术还不够成熟,随着7.14版本的发布,可搜索快照技术才真正能够大规模用于生产实践中。本文将基于ES 7.14.2版本,继续从原理和实践两个角度向大家介绍可搜索快照技术。
腾讯云大数据
2021/12/29
1.4K1
Elasticsearch 可搜索快照技术原理及最佳实践
elasticsearch迁移最佳实践
把IDC自建的es集群与腾讯云es集群互通,做成一个大集群,通过es本身的数据同步功能做同步。
迁云小助手
2021/09/05
1.3K0
干货 | Elasticsearch 索引生命周期管理 ILM 实战指南
关于人生,有人这么说:“人,生来一个人,死去一个人,所以,人生就是一个人生老病死的简称。”
铭毅天下
2021/06/25
7.2K1
干货 | Elasticsearch 索引生命周期管理 ILM 实战指南
Elasticsearch可搜索快照技术原理及最佳实践
Elasticsearch于7.10版本推出可搜索快照功能,但是7.10版本的可搜索快照技术还不够成熟,随着7.14版本的发布,可搜索快照技术才真正能够大规模用于生产实践中。本文将基于ES 7.14.2版本,继续从原理和实践两个角度向大家介绍可搜索快照技术的。
吴容
2021/11/27
2.1K3
Elasticsearch可搜索快照技术原理及最佳实践
【Elasticsearch系列之八】通过reindex迁移ES数据
reindex 是 ES 提供的一个 api 接口,可以把数据从源 ES 集群导入到当前 ES 集群,实现集群内部或跨集群同步数据。
Vicwan
2020/04/27
9.9K0
Elasticsearch跨集群数据迁移
如果是第一种场景,数据迁移过程中可以停止写入,可以采用诸如elasticsearch-dump、logstash、reindex、snapshot等方式进行数据迁移。实际上这几种工具大体上可以分为两类:
HLee
2021/01/20
1.5K0
Elasticsearch跨集群数据迁移
Elasticsearch:Index 生命周期管理入门
如果你要处理时间序列数据,则不想将所有内容连续转储到单个索引中。 取而代之的是,您可以定期将数据滚动到新索引,以防止数据过大而又缓慢又昂贵。 随着索引的老化和查询频率的降低,您可能会将其转移到价格较低的硬件上,并减少分片和副本的数量。
腾讯云大数据
2020/10/09
3.9K1
Elasticsearch:Index 生命周期管理入门
腾讯云 Elasticsearch 运维篇(十三)数据迁移
前面我们通过通过腾讯云控制台快速构建了一个ES集群,并能通过云控制台管理界面或者CVM操作管理ES集群。我们知道ES是一个存储搜索分析引擎,那么如何让自己的现有的ES集群的数据跨平台的迁移到腾讯云上来呢??我们推荐ES官方的snapshot方法。下面为大概的过程(因为本人账号属于集体账号,处于安全考虑后面的部分过程粗略讲一下)
南非骆驼说大数据
2020/02/23
2.7K0
ElasticSearch ILM实践
在ES没有提供ILM功能以前,我们的索引生命周期管理一般是自己写脚本或者curator工具来管理的。
保持热爱奔赴山海
2022/05/15
6200
ElasticSearch ILM实践
E往无前 | get正确使用姿势!腾讯云大数据ES日志场景优化案例回顾
随着ELK方案在开源日志分析领域越来越流行,各种业务场景也给ELK方案带来了越来越多的挑战。本文将回顾一次真实客户案例,从使用姿势上,提供一些大集群、多日志主题场景下的集群优化思路。
腾讯QQ大数据
2023/07/26
3040
E往无前 | get正确使用姿势!腾讯云大数据ES日志场景优化案例回顾
腾讯云Elasticsearch集群运维常用命令详解三(索引篇)
在前两篇文章里,我们分别从集群和节点层面向大家介绍了日常集群运维工作中常用到的一些命令。接下来我们继续从索引层面来介绍几个常用到的集群运维API。
吴容
2021/12/23
2.8K2
腾讯云Elasticsearch集群运维常用命令详解三(索引篇)
Elasticsearch索引全生命周期一网打尽
索引(Index)是Elasticsearch中最重要的概念之一,也是整个Elasticsearch操作的基础,它是相互关联的文档的一个集合。在Elasticsearch种,数据存储为 JSON 文档,每个文档将一组键(字段或属性的名称)与其对应的值(字符串、数字、布尔值、日期、地理位置或其他类型的数据)相关联,Elasticsearch 使用一种称为倒排索引的数据结构,旨在实现非常快速的全文搜索。倒排索引列出了出现在任何文档中的每个唯一单词,并标识了每个单词出现的所有文档。
MCNU云原生
2023/03/17
1.1K0
Elasticsearch索引全生命周期一网打尽
推荐阅读
相关推荐
Elasticsearch 索引生命周期管理详解与实践汇总篇
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档