蓝鲸作业平台项目背景 蓝鲸作业平台是一套运维基础操作管理系统,具备海量任务并发处理能力;除了支持脚本执行、文件分发、定时任务等一系列基础运维场景以外,还支持通过流程调度能力将零碎的单个任务组装成一个自动化作业流程...丰富的平台管理能力 支持平台信息/配置定制化、运营数据统计、微服务无损更新与服务状态监控,为快速迭代提供支持。...行业应用 蓝鲸作业平台在腾讯IEG内部广泛使用,为上千个业务提供了运维作业执行服务,日执行作业量达到千万级别;同时,作为蓝鲸的原子平台之一,拥有大量社区用户,在业界拥有一定的影响力。...国内镜像地址: https://git.code.tencent.com/Tencent_Open_Source (登录后才能访问公开项目) 腾讯工蜂源码系统为开源开发者提供完整、最新的腾讯开源项目国内镜像...关注腾讯开源公众号 获取更多最新腾讯官方开源信息!
今天推荐的这个项目是「bk-job」—— 蓝鲸作业平台 (Job),一套腾讯开源的运维脚本管理系统,具备海量任务并发处理能力。...除了支持脚本执行、文件分发、定时任务等一系列基础运维场景以外,还支持通过流程调度能力将零碎的单个任务组装成一个自动化作业流程; 而每个作业都可做为一个原子节点,提供给上层或周边系统/平台使用,实现跨系统调度自动化...脚本管理:将脚本以云化模式统一管理,更好的支持作业编排和周边系统调度的灵活度 账号管理:管理服务器 OS 的执行账户,如 Linux 的 root,Windows 的 administrator 等等...消息通知:满足业务按管理需求设置任务不同状态的执行结果消息通知 文件源管理:开放文件源对接插件能力,满足从不同文件系统类型拉取文件并传输的诉求 运营分析:提供平台的运营统计数据展示,助力管理员更全方位的了解平台的运行情况...平台管理:丰富的平台管理员工具,包括但不仅限于信息更改、消息渠道设置、高危语句检测规则、功能限制设置、公共脚本管理、后台服务状态展示等等 2架构设计 ?
ferry 工单系统介绍 ferry工单系统是一个集工单统计、任务钩子、RBAC权限管理、灵活配置流程与模版于一身的开源工单系统,当然也可以称之为工作流引擎。...灵活配置流程及模版:通过后台管理,实现拖拖拽拽就能创建出一个完成的工作流和模版,并可以绑定模版。进行表单输入。...当然还有更多更好更妙的功能,比如:并行阶段处理,条件判断处理,会签功能,处理人实现变量管理等等。...[image] 后端使用的casbin及自己维护的扩展表进行权限管理,前端按钮的展示则通过v-permisaction来进行维护管理。 任务钩子 通过对每个阶段进行任务绑定来实现,流程中的任务执行。...开源不易,请用一个star表表心意感谢。
设备运维管理系统在于解决功能更丰富、业务流程更智能、自动化、适用场景更加灵活,给用户提供了更加智能化的应用与便捷性操作,提高办公效率和设备可靠性,减少工作人员的劳动强度,减少办公耗材。...一、设备运维管理平台设备远程运维管理系统致力于设备管理科学化,以设备全生命周期为主线,兼顾点巡检、设备档案、备品备件、能耗统计管理,同时采用自有的物联软硬件技术实现设备状态的实时监控与故障预警,帮助企业实现设备的规范化...二、解决客户实际问题管理混乱,设备台账信息不齐全设备无纸化管理,通过每日点检收集设备数据,结合保养、维修功能对设备进行全面管理,全面感知设备状态;设备利用率低,管理手段无力设备运行状态监测,结合三色安灯管理...,自动生成故障清单,自动推送维修班组,维修绩效考核,结合备品备件管理,降低配件库存,提高流转效率,避免长期的备件等待;三、解决方案亮点功能首页导航-实时预览设备状态系统首页实时统计各状态下设备数量;展示工单梳理列表和近...系统设备管理菜单下可实时查看设备运行状态,指标监测,历史数据等功能,方便设备运行监测、质量工艺监管等。
03 相关技术 相关理论标准 基本理论基础:Petri网的数学概念 流程建模规范:BPMN 典型的开源流程引擎 Activiti JBPM 运维流程管理 01 运维流程概述 IT运维流程管理属于ITOM...“管理流程”,仅连接了“人”与“人”,而无法和各个运维管理系统打通集成。...因此很多企业会考虑把和IT运维紧密关联的流程独立出来,由专门的运维流程管理系统来承载,实现人与人、人与系统、系统与系统之间端到端的流程管理。 ?...运维流程管理工具除了具备流程系统基本的功能之外,还应该具备: 根据运维管理的特点提供对应的功能特性,如:监控事件接入、变更技术复核、变更日历等。...它与运维门户、运维可视化、监控告警、CMDB、自动化运维工具、CMP等进行无缝集成,将运维的人与人、人与系统、系统与系统进行连接,是运维工作的“总线”。
开发运维管理后台的过程中使用到的东东有:python2.7、django、celery、javascript、jquery等.... 一、登录界面 ?...三、授权申请提交后,管理员后台对收到的任务进行授权处理 ? ? 四、授权处理完成之后,新账号就有了所有页面的访问权限 左侧的新增菜单导航就是管理员授权通过后,新用户才会看到对应的页面 ?...五、管理后台一些功能介绍 1、流程管理,涉及使用者流程的申请,管理员处理流程等功能,需要新增流程的话,直接开发对应的流程任务添加到管理后台中即可。 ?...2、统一账号管理,自己开发的管理模块,没有采用django admin自带的用户管理模块。 ?...4、页面管理,用来动态的添加和删除页面,避免了将页面写死到代码里,后期管理维护不方便。 ? 5、管理平台中具体的子页面功能就不做展示,有感兴趣的可以私信了解。
;6.性能优化,对系统及相关组件性能进行优化;7.系统高可用,对应用系统中的单点进行高可用升级;8.SLA保障,保证业务系统的可用性,可根据SLA实现自动扩缩容;以上工作是根据运维管理框架进行提取,包含但并不限于以上几方面...因此目前我们总结的运维管理主要目标是标准化/规范化,自动化,可视化/web化。其中标准化可根据运维实际情况进行制定;而可视化/web化,可以通过开源工具或web开发实现。...另外,对于大中型运维自动化平台而言, CMDB和配置系统依然不可或缺。CMDB即配置管理数据库,一般用于统一管理IT数据、服务器数据资产等。...7.2 运维管理文章开头说运维管理主要目标是标准化/规范化,自动化,可视化/web化,从切身体验来看运维管理的目标也是随着运维自动化阶段的不同而变化的。...运维不是因为技术高深,或者管理了几万台服务器而很牛逼,也不是能玩转很多开源工具而很牛逼,这都不是运维的关键。对于运维来说,服务第一,技术第二。
image.png image.png image.png image.png limit配置项: image.png 密码需定期更新 image.png image.png 密码策略(系统安全配置策略
是集用户管理(Account)、授权管理(Authorization)、认证管理(Authentication)和综合审计(Audit)于一体的集中运维管理系统。...4、集中身份认证 内网运维综合审计管理系统为用户提供统一的认证接口,支持多种认证方式。...6、集中访问控制 内网运维综合审计管理系统能够提供细粒度的访问控制,最大限度保护用户资源的安全。...8、工单审批 内网运维综合审计管理系统支持工单审批模式,第三方运维人员或普通运维用户访问特定的服务器设备必须经过管理员的临时审批授权才能进行运维操作,更好的提高运维流程简单并记录相应操作。...9、计划任务 内网运维综合审计管理系统支持建立计划任务,对被管资源进行口令修改(手动指定/随机生成)、账号同步、脚本执行等任务配置,方便运维人员对资源的维护,减少重复工作,提高运维效率。
把CentOS启动进度条替换为详细信息 : CentOS 6 启动的时候,是一个进度条,并不像以前CentOS5启动的时候显示启动的信息,这是因为有一个参数所控...
管理与运维 可视化界面 通过50070端口,可以访问HDFS Web UI:http://activeNameNodeHost:50070,需将activeNameNodeHost自行替换为主节点IP,
#ifup ens33 :打开ens33这个网卡 有时候我们通过远程连接工具连接服务器,如果必须重启某个特定的网卡我们需要这样操作: #ifdown ens33 && ifup ens33 在日常的运维当中...针对CentOS7系统,默认的防火墙机制是firewalld,(当使用iptables -nvL 发现有很多表链的时候使用如下关闭firewalld)但是如果你想不用firewalld而选择使用centos
监控io性能 : 有时候发现系统cpu和内存均有剩余,但是负载却很高,使用vmstat发现b列和wa列负载很高,要是想更详细的查看磁盘状态,那我们就用到了今天所讲的iostat。...---- 查看系统进程(ps) : #ps aux (静态的查看系统所有的进程,top是动态的) STAT部分说明: D 不能中断的进程(不经常看到的进程) R run状态的进程 S sleep...查看网络状态 #ss -an 用的比较多的一个命令,用来查看连接状态 #ss -an |grep -i ESTAB 只查看已经建立的连接 #netstat -lnp 查看监听端口 #netstat -an 查看系统的网络连接状况...ESTABLISHED:客户端与服务端已经建立数据连接(并发连接数) TIME_WAIT:客户端与服务端连接还没有断开,处于等待的一个状态 LISTEN: 侦听状态 实用运维管理命令: 一次性查看所有的连接状态...指定保存位置(但是我们保存的1.cap是不可以直接cat查看的) 如果不晓得一个文件是什么类型的文件可以使用 file /tmp/1.cap #tcpdump -r /tmp/1.cap -r: 读取 实用运维管理命令
设备运维管理系统是如何提升企业生产经营效率的?...1、推进信息化建设,打破数据孤岛①设备联网实时查看设备运行状态数据;②打通工业企业系统间的数据通道;③将人工记录、纸质表单等流程转换为系统化管理;2、提高运维人员的工作效率①实时查看点检⼈员点检时间和点检进度...;设备远程运维管理系统,以设备全生命周期为主线,包含:设备的点检管理、维修管理、保养管理等无纸化管理措施,同时采用自有的物联软硬件技术实现设备状态的实时监控与故障预警,帮助企业实现设备的规范化、科学化、...设备远程运维管理系统广泛应用于智能制造、医疗器械、机器设备、酒店设备、消防安全、安防监控、工地监控等服务场景。...02点检管理自动化通过在系统创建设备点检计划,系统让纸质点检转变为在线点检,运维人员按照标准点检计划开展工作,避免漏检误检,提升巡检效率。
监控系统状态 w: # w/uptime:查看系统负载 16:08:52 up 2 days, 21:49, 1 user, load average: 0.00, 0.00, 0.00 USER...开机了多少天 当前用户(下面会显示详细的用户,pts/0 意思是:当前用户是通过网络登录,tty1 是代表直接登录) 系统平均1分钟负载状态,平均5分钟负载状态,平均15分钟负载状态。...# cat /proc/cpuinfo //查看cpu核数 ---- vmstat: # vmstat:监控系统状态 procs -----------memory---------- -...swpd,交换空间,当内存不够的时候,系统可以临时把一些进程移到swp中去。...,每隔两秒显示一次,显示10次 通过vmstat我们可以判断出系统哪部分硬件资源不足!
《CentOS 7系统管理与运维实战》共13章,分为3个知识区块。...涵盖的主要内容有:以CentOS 7特性和安装、运维基础、网络配置与结构为第壹个知识区块的基础知识;企业中应用广泛的路由与策略路由,针对不同应用平台的文件共享服务NFS、Samba和FTP,目前最常见的...Web平台LAMP、LNMP,中小型企业应用最为广泛的LVS集群技术,实现高可用性的双机热备系统等为第二知识区块的应用平台建设与管理方面的知识:目前最热门的虚拟化和云计算为第三知识区块,主要有KVM虚拟化及...oVirt管理平台,适合企业使用的GlusterFS存储技术,OpenStack和OpenNebula云平台等知识。
本文将介绍图扑 HT for Web 手机端运维管理系统,在企业中提高运维效率的方法,并为运维团队带来全新的管理方式,包括维修、巡检、保养、报警以及设备台账等监管操作。...提高设备可靠性和全生命周期管理效率,实现企业数字化运维,确保 IT 系统的稳定性和可用性。...图扑软件利用自研 HT UI 通用组件开发工具包产品,打造的手机端运维管理系统(移动网页应用或 Web App)。...借助 HT UI 组件库搭建手机端运维管理系统或者 PC 后台管理系统,可以较大程度节省开发成本和周期。也因为是 Web 端的应用软件,所以支持跨平台兼容各个操作系统,或跨设备兼容各个终端设备。...辅助企业管理、高效迅捷等管理需求。 手机端运维管理系统正逐渐改变着我们对运维管理的认知,为企业提供了数字化、高效率、高质量的管理方式,帮助企业提高运维效率,降低维护成本。
运维开发的开源项目很多,从很多人的理解中,开源就是把代码一开放就完事了,当然远远没有这么简单。其实如果在GitHub上观察多一些,那些顶级项目都是更新频繁,功能迭代很快的。...运维开发的项目说实话远没有这些开源项目这么火,也没有如此多的更新频率。只能说一些现状和情况情况有些相仿,那些能够活下来的项目,都是经历了一些苦闷的阶段。...我之前的运维平台参考了OpsManage的内容,但是在后期实现的时候,初步的设想是定制一下,修改一些基本的页面满足功能,然后逐步接入业务。...我做了很多的尝试,也做了一些定制的功能,从技术的架构和权限管理上也下了很多的功夫。...有一个事情对我触动很大,是前些天,有个同事对于系统里有几个小的需求,虽然说不上严重,但是这个会直接影响到他的正常使用,比如他要修改某个字段的值,要做一些权限上的管理,但是看不到那个按钮,看不到那个属性,
管理员/运维人员可以通过以下方式了解Hudi数据集/管道 通过Admin CLI进行管理 Graphite指标 Hudi应用程序的Spark UI 本节简要介绍了每一种方法,并提供了有关故障排除的一些常规指南...Hudi库使用.hoodie子文件夹跟踪所有元数据,从而有效地在内部管理该数据集。 初始化hudi表,可使用如下命令。...文件系统视图 Hudi将每个分区视为文件组的集合,每个文件组包含按提交顺序排列的文件切片列表(请参阅概念)。以下命令允许用户查看数据集的文件切片。....111415c3-f26d-4639-86c8-f9956f245ac3_20181002180759.log.1}]| [] | hoodie:stock_ticks_mor-> 统计信息 由于Hudi直接管理...将来,将在项目中添加更复杂的调试/管理UI,以帮助自动进行某些调试。
运维管理 1 集群搭建 1.1 单Master模式 这种方式风险较大,一旦Broker重启或者宕机时,会导致整个服务不可用。不建议线上环境使用,可以用于本地测试。...打印帮助-bBrokerName,注意不同于Broker地址-s消息大小,单位B-c发送次数 2.4 消息相关 名称含义命令选项说明queryMsgById根据offsetMsgId查询msg,如果使用开源控制台...值-ttopic 名称-h打印帮助-nNameServer 服务地址,格式 ip:portqueryMsgByUniqueKey根据msgId查询,msgId不同于offsetMsgId,区别详见常见运维问题...kkey-vvalue 2.8 其他 名称含义命令选项说明startMonitoring开启监控进程,监控消息误删、重试队列消息数等-nNameServer 服务地址,格式 ip:port-h打印帮助 3 运维常见问题...3.1 RocketMQ的mqadmin命令报错问题 问题描述:有时候在部署完RocketMQ集群后,尝试执行“mqadmin”一些运维命令,会出现下面的异常信息: org.apache.rocketmq.remoting.exception.RemotingConnectException
领取专属 10元无门槛券
手把手带您无忧上云