因此我们做的某些操作并不是孤立的,会牵扯到不同的层次,是可以有生命周期的。...我们就会孤立的重复操作,而忽略其实我们可以通过一套自动化流程彻底解决问题。...2 运维规范终于来到重点了,运维规范是如何生成的?...运维规范从来不是凭空捏造的,需要从碎片化的运维工作提取事实依据来生成碎片化的运维工作存在于运维框架各个层面,因此运维规范按框架分层提取明白以上两点后,我们就可以按照运维框架中的各个层次来提取了。...1.基础设施服务操作系统安装规范目录管理规范系统配置(初始化)规范JDK安装规范网络设备配置规范等等2.系统应用规范系统上线规范进程管理规范备份管理规范hosts规范等等3.平台服务规范监控管理规范系统巡检规范日志收集规范跳板机管理规范
下述操作均需要在具体运行服务的那个节点上运行,而不是admin节点!!!...数据回填和恢复操作可能会产生大量的后端流量,影响集群性能。...为避免性能降低,可对回填/恢复操作进行配置: osd_recovery_op_priority # 值为1-63,默认为10,相对于客户端操作,恢复操作的优先级,默认客户端操作的优先级为63,参数为osd_client_op_priority...,默认为10 osd_backfill_scan_min # 回填操作时最小扫描对象数量,默认为64 osd_backfill_scan_max # 回填操作的最大扫描对象数量,默认为512 osd_backfill_full_ratio...如果ceph的monitor节点超过半数挂掉,paxos算法就无法正常进行仲裁(quorum),此时,ceph集群会阻塞对集群的操作,直到超过半数的monitor节点恢复。
常用操作 2.1 查看pg组映射信息 $ ceph pg dump 2.2 查看一个PG的map $ ceph pg map 1.2f6 osdmap e7768 pg 1.2f6 (1.2f6) ->
常用操作 2.1 查看pool里所有镜像 $ rbd ls rbd 03aa248c-0de5-45e5-9c2b-5fe26b230275 97ee910f-8427-4b58-9b6a-4ed3df7049d0
常用操作 2.1 查看pool数量 $ ceph osd lspools 1 rbd,2 test_data,3 test_metadata,5 test,6 benmark_test,7 .rgw.root...18 size to 3 2.11 查看pool池副本数 $ ceph osd pool get test_lihang size size: 3 2.12 设置pool池写最小副本 #设置pool池写操作最小副本为
常用操作 2.1 查看mon状态 $ ceph mon stat e1: 3 mons at {ceph-xx-osd00=10.69.0.1:6789/0,ceph-xx-osd01=10.69.0.2
常用操作 2.1 查看osd状态 $ ceph osd stat 5 osds: 5 up, 5 in 状态说明: 集群内(in) 集群外(out) 活着且在运行(up) 挂了且不再运行(down) 说明...#有时候某个 OSD 与其它的相比并不适合做主 OSD (比如其硬盘慢、或控制器慢),最大化硬件利用率时为防止性能瓶颈(特别是读操作), #你可以调整 OSD 的主亲和性,这样 CRUSH 就尽量不把它用作...如果你不想在停机维护 OSD 时让 CRUSH 自动重均衡,提前设置 noout $ ceph osd set noout 2.26 取消停止自动均衡 #跟ceph osd set noout相反的操作
常用操作 2.1 查看mds的状态 $ ceph mds stat test_fs-1/1/1 up test1_fs-1/1/1 up {[test1_fs:0]=ceph-xx-osd03.gz01
1.说明 1.1介绍 RADOS全称Reliable Autonomic Distributed Object Store,是Ceph集群的精华,用户实现数据分配、Failover等集群操作。 2....常用操作 2.1 查看集群多少个pool $ rados lspools rbd test_data test_metadata test benmark_test .rgw.root default.rgw.control
不要将不同功能的脚本放到一个路径 本例是传输专业,给外系统提供接口数据,直真公司缩写zznode,故名字定义为trans_to_zznode,创建路径 /opt/tmn/wlzy/trans_to_zznode 2.2 脚本目录规范
通过定义开放的标准,OCI 促进了容器技术的互操作性和兼容性,使得开发者和运维人员可以更方便地使用和管理容器化应用。...操作接口 OCI运行时规范定义了一组标准的操作接口,用于管理容器的生命周期。这些操作包括: create:根据config.json文件创建一个新的容器。 start:启动已创建的容器。...OCI 运行时规范实现 OCI 运行时规范定义了容器的创建、启动、停止、删除等操作。...OCI 的影响 互操作性:OCI 规范确保了不同容器平台和工具之间的兼容性和互操作性,使得容器化应用可以在各种环境中无缝运行。...标准化:OCI 通过提供开放的标准,促进了容器技术的广泛应用和发展,帮助开发者和运维人员更好地管理和运行容器化应用。
基本概念 1.1 什么是 Scrub Scrub是 Ceph 集群副本进行数据扫描的操作,用于检测副本间数据的一致性,包括 scrub 和 deep-scrub。...配置 为了避开客户业务高峰时段,建议在晚上0点到第二天早上5点之间,执行scrub 操作。...2.1 设置标识位 在任一monitor节点进行如下操作: ceph osd set noscrub ceph osd set nodeep-scrub 2.2 临时配置 先通过tell 方式,让scrub...时间区间配置立即生效,在任一monitor节点进行如下操作: ceph tell osd.* injectargs '--osd_scrub_begin_hour 0' ceph tell osd.*...0点 osd_scrub_end_hour = 5 # scrub操作的结束时间为5点#ps: 该时间设置需要参考物理节点的时区设置 osd_scrub_chunk_min = 1 #标记每次
1 需求关于CMDB使用过程中的一次总结,通过CMDB的认识、进化、流程规范支撑、运维场景驱动等方面的介绍,让我们快速了解如何通过CMDB管理基础设施;CMDB为上层应用如何提供数据支撑;2 认识CMDB2.1...例如虚拟机这个CI,有以下属性:IP地址、主机名、CPU、内存、创建时间、操作系统等。CI属性类型 每个CI属性都有其数据类型,可以理解为表中的字段类型。例如:符串、整数、下拉菜单、浮点数等。...DevOps提供数据支撑4 流程规范对于CMDB的管理可能会涉及到基础运维和应用运维等多个岗位,其中:基础运维负责物理机等硬件设备的管理IP、资源基础信息的录入应用运维负责业务IP、业务、应用、模块等信息的分配由于业务...IP关联至管理IP及分配至业务/模块都是依赖基础运维已经将服务器资源录入,因此我们需要一个通用的流程规范来保证此项工作按序展开。...图片5 场景驱动当我们已经将业务IP分配至业务/模块后,剩下的就是我们通过CMDB全面的API服务为不同的运维场景提供数据支撑了。
操作 CRUSH Map 2.1 提取CRUSH Map #提取最新crush图#ceph osd getcrushmap -o {compiled-crushmap-filename} $ ceph...一个桶的权重是一维的,你也可以计算条目权重来反映存储设备性能。...最大化硬件利用率时为防止性能瓶颈(特别是读操作), 你可以调整 OSD 的主亲和性,这样 CRUSH 就尽量不把它用作 acting set 里的主 OSD 了。
这是专栏《Redis 运维实战》的最后一篇,感谢您的阅读。也感谢 9 篇文章的审稿人:无为,提出了多个修改建议,让文章内容更全面。...2.4 不建议使用 Redis 事务 因为 Redis 事务不支持回滚,而且集群版本要求一个事务操作的 key 必须在一个 slot 上。...专栏《Redis 运维实战》系列文章推荐 Redis 运维实战 第01期:Redis 复制 Redis 运维实战 第02期:Redis Cluster Redis 运维实战 第03期:Codis Redis...运维实战 第04期:AOF 持久化 Redis 运维实战 第05期:RDB 持久化 Redis 运维实战 第06期:Bigkey Redis 运维实战 第07期:Hotkey Redis 运维实战 第...08期:监控 Redis 运维实战 第09期:Redis 规范
add-remove-osd-s-3010589e52a0-52209664osd3011 增加mon Mon增加之前需要像上面的增加osd那样先去初始化好机器,特别是机器的hostname,ceph依赖高版本的内核,如果是操作系统首选...centos7(centos6要退出历史舞台了),hostname中不要带- \等之类的特殊操作符号,就中规中矩字母+数字。...{mon-id} 或者 /etc/init.d/ceph stop mon 清理mon map ceph mon remove {mon-id} 运维大多是起起停停,要想少点这种体力活,事先要有一个好的规划...这是一些比较常用的操作: 创建一个远程块设备,指定大小为100GB rbd create --size 102400 foo(默认使用rbd的pool,也可以这样指定rbd create bar --size
流程机制故障发现后,On-Call 的 SRE 或 运维,故障指挥官 有权召集相应的业务开发或其它必要资源,快速组织 事故处理小组。...如果问题和恢复过程非常明确,故障指挥官 仍然是 SRE 或 运维,就不做转移,由他来指挥每个人要做的具体事情,以优先恢复业务优先。...详细流程图```sequenceOnCall运维->故障:发现故障OnCall运维->OnCall运维: 初步分析故障原因OnCall运维->事故处理小组: 召集业务开发或其它必要资源事故处理小组->事故处理小组...: 事故反馈(10-15分钟一次)事故处理小组->事故处理: 事故排查OnCall运维-->高管: 问题疑难,影响范围很大,事故升级高管-->事故处理小组: 全权管理,进行下一步协商处理事故处理->事故处理...事故时间流记录以事件时间流的方式记录出现事故前,事故中的操作记录注:时间能精确就精确记录人: (由指定人记录)时间事件操作人备注2021/09/28 12:20:20将LB带宽从10Mb到20Mb事故处理小组由事故响应者组织一个事故小组群
exit quit the mongo shell > 这是MongoDB最顶层的命令列表,主要告诉我们管理数据库相关的一些抽象的范畴:数据库操作帮助...、集合操作帮助、管理帮助。...如果你想了解数据库操作更详细的帮助命令,可以直接使用db.help(),如下所示: > db.help() DB methods: db.adminCommand(nameOrDocument)...,不允许执行写数据操作,一般在执行数据库备份时有用。...terminate the fsync write/snapshot lock" } 其中,fsyncLock为1表示MongoDB的fsync进程(负责将写入改变同步到磁盘)不允许其他进程执行写数据操作
[TOC] 0x00 前言 描述:rm -rf *这个命令给每个使用linux系统的工程师带来了深深的恐惧, 它能使您的服务器变得空空如也可以说简直就是一个大灾难; 但下面就是再Linux运维过程中误删除.../etc/目录后救命止损的数据恢复流程, 希望能帮助到更多的Ops解决当下问题; 案例1:误删/etc目录数据 应急流程: 1.要保持连接不被断开不操作时用vim保持连接状态 2.如不能正常登录,拷贝相同版本服务器
**导读** > 作者:杨漆 > 16年关系型数据库管理,从oracle 9i 、10g、11g、12c到Mysql5.5、5.6、5.7、8.0 到TiDB获得3个OCP、2个OCM;运维路上不平坦...一、Tiup 常用运维操作命令干货 1.查看集群列表: tiup cluster list 2.启动顺序 PD->tikv->pump->tidb->tiflash->drainer tiup cluster...ignore-role 172.30.20.2 12.销毁集群(关闭服务、清空数据和部署目录,无法恢复) tiup cluster destory ${cluster-name} 二、Tidb Ansible 常用运维操作命令干货...但还需要使用tiup edit-config 命令来修改对应的配置项,否则upgrade 和reload 等运维操作会将在线修改配置后的结果 覆盖。...执行tiup edit-config 后不需要执行tiup reload 操作。
领取专属 10元无门槛券
手把手带您无忧上云