前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >ES报错赏析

ES报错赏析

原创
作者头像
ES小助理
修改2022-04-28 11:13:19
1.2K0
修改2022-04-28 11:13:19
举报
文章被收录于专栏:ES排障

--------日志----------


CheckSum异常,不允许分片上线

日志报错:

代码语言:javascript
复制
org.apache.lucene.index.CorruptIndexException: checksum failed (hardware problem?) : expected=1wawfr3 actual=ux64oi (resource=name [_dem.fdt], length [2731835920], checksum [1wawfr3], writtenBy [8.7.0]) (resource=VerifyingIndexOutput(_dem.fdt))

解析:

一般是因为磁盘或系统问题导致的分片文件损坏,es checksum异常

解决:

  1. 参考官网进行保守修复:https://www.elastic.co/guide/en/elasticsearch/reference/current/shard-tool.html。若系统一直为reblance,需要把cluster.routing.allocation.allow_rebalance的值,改成 indices_primaries_active

2. 停机修复:https://www.elastic.co/guide/en/elasticsearch/reference/current/shard-tool.html

3. 不停机修复:用lucene里面提供的工具试了下,主要参考如下文章:

代码语言:javascript
复制
https://mincong.io/cn/elasticsearch-corrupted-index/
然后按照下面的步骤处理了下,感觉有点绕远,理论上直接remove掉分配过期的分片就行
1. 把有问题的分片数据copy出来
2. 指定日志里面报错的segment检测下,有问题的segment名字是 _dem,然后确实有报错
/data/c_log/repository/jdk/kona11.0.9.1.b1/bin/java -cp lib/lucene-core-8.7.0.jar:lib/ohc-core-0.7.0.jar  -ea:org.apache.lucene... org.apache.lucene.index.CheckIndex /data1/containers/data_bak/index -segment _dem
3. 然后修复 
/data/c_log/repository/jdk/kona11.0.9.1.b1/bin/java -cp lib/lucene-core-8.7.0.jar:lib/ohc-core-0.7.0.jar  -ea:org.apache.lucene... org.apache.lucene.index.CheckIndex /data1/containers/data_bak/index -exorcise
4. close索引,替换分片的索引文件目录
5. reopen

---------Explain API-----------


磁盘满

日志报错:

代码语言:javascript
复制
the node is above the high watermark cluster setting \[cluster.routing.allocation.disk.watermark.high=95%\], using more disk space than the maximum allowed \[95.0%\], actual free: \[4.05%\]

解决方法:

扩容磁盘或者删除数据


分配文档数超过最大值限制

日志报错:

代码语言:javascript
复制
failure IllegalArgumentException\[number of documents in the index cannot exceed 2147483519

解决方法:

向新索引中写入数据,并合理设置分片大小


原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • --------日志----------
  • CheckSum异常,不允许分片上线
    • 日志报错:
      • 解析:
        • 解决:
        • ---------Explain API-----------
        • 磁盘满
          • 日志报错:
            • 解决方法:
            • 分配文档数超过最大值限制
              • 日志报错:
                • 解决方法:
                相关产品与服务
                Elasticsearch Service
                腾讯云 Elasticsearch Service(ES)是云端全托管海量数据检索分析服务,拥有高性能自研内核,集成X-Pack。ES 支持通过自治索引、存算分离、集群巡检等特性轻松管理集群,也支持免运维、自动弹性、按需使用的 Serverless 模式。使用 ES 您可以高效构建信息检索、日志分析、运维监控等服务,它独特的向量检索还可助您构建基于语义、图像的AI深度应用。
                领券
                问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档