前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >蓝鲸自动化运维平台

蓝鲸自动化运维平台

作者头像
全栈程序员站长
发布于 2022-08-30 00:57:23
发布于 2022-08-30 00:57:23
11.3K02
代码可运行
举报
运行总次数:2
代码可运行

大家好,又见面了,我是你们的朋友全栈君。

蓝鲸自动化运维平台

1.蓝鲸简介

官网:https://bk.tencent.com/docs/

腾讯蓝鲸智云,简称蓝鲸,是腾讯互动娱乐事业群(Interactive Entertainment Group,简称 IEG)自研自用的一套用于构建企业研发运营一体化体系的 PaaS 开发框架,提供了 aPaaS(DevOps 流水线、运行环境托管、前后台框架)和 iPaaS(持续集成、CMDB、作业平台、容器管理、数据平台、AI 等原子平台)等模块,帮助企业技术人员快速构建基础运营 PaaS。

2.蓝鲸部署

2.1.环境准备

操作系统

CPU

内存

IP

centos7.5

8核

6.5G

192.168.81.240

2.2.关闭Selinux

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[root@localhost ~]# setenforce 0
[root@localhost ~]# sed -ri '/^SELINUX=/c SELINUX=disabled' /etc/selinux/config 
[root@localhost ~]# sed -ri '/^SELINUX=/c SELINUX=disabled' /etc/sysconfig/selinux 

2.3.关闭防火墙/网络配置器

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[root@localhost ~]# systemctl stop firewalld.service 
[root@localhost ~]# systemctl disable firewalld.service
Removed symlink /etc/systemd/system/multi-user.target.wants/firewalld.service.
Removed symlink /etc/systemd/system/dbus-org.fedoraproject.FirewallD1.service.
[root@localhost ~]# systemctl stop NetworkManager
[root@localhost ~]# systemctl disable NetworkManager

2.4.调整最大文件打开数

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[root@localhost ~]# echo 'root soft nofile 102400' >> /etc/security/limits.d/20-nproc.conf 
[root@localhost ~]# echo 'root hard nofile 102400' >> /etc/security/limits.d/20-nproc.conf
[root@localhost ~]# reboot

2.5.配置yum仓库

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[root@localhost ~]# curl -o /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo ;curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo
[root@localhost ~]# ls /etc/yum.repos.d/
CentOS-Base.repo  epel.repo

2.6.准备软件包

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
程序包
https://bk.tencent.com/download/
ssl认证文件
https://bk.tencent.com/download_ssl/

2.7.非标准ip处理方法

蓝鲸社区版部署脚本install目录下从以下文件中获取ip的函数get_lan_ip,非标准地址,在部署前都要完成修改

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[root@localhost install]# grep -l 'get_lan_ip *()' -r /data/install/

修改方法:

假设服务器ip是129.x.x.x

2.8.安装paas、cmdb、job

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
1)准备安装目录
[root@localhost soft]# mkdir /data

2)解压
[root@localhost soft]# tar xf bkce_src-5.1.28.tar.gz /data
[root@localhost ~]# ls /data/
install  src

3)解压ssl认证
[root@localhost ~]# tar xf /soft/ssl_certificates.tar.gz  -C /data/src/cert/

4)环境检测
[root@localhost install]# ./precheck.sh 
如果报错则使用-r重新检测
[root@localhost install]# ./precheck.sh -r

5)部署组件
如果部署所有组件
[root@localhost install]# ./install_minibk -y
按需部署则
[root@localhost install]# ./install_minibk 
[root@localhost install]# ./install_minibk paas && ./install_minibk cmdb && ./install_minibk job

pass组件安装成功

cmdb组件安装成功

job组件安装成功

2.9.安装app_mgr

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[root@rbtnode1 install]# ./bk_install app_mgr

2.10.安装pkdata

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[root@rbtnode1 install]# ./bk_install bkdata

2.11.安装fta

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[root@rbtnode1 install]# ./bk_install fta

2.12.安装gse_agent

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[root@rbtnode1 install]# ./bk_install gse_agent

2.13.安装saas-o

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[root@rbtnode1 install]# ./bkcec install saas-o

2.14.以上全部安装好后安装节点管理

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[root@rbtnode1 install]# ./bk_install saas-o bk_nodeman

3.故障解决

3.1.安装app_mgr报错

原因:paas_agent启动失败,没有解析到paas

解决方法:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
解析paas
/data/bkce/bin/health_check/check_proc_exists -m paas

查看一下appt的状态
[root@rbtnode1 install]# ./bkcec status appt
[192.168.81.240] paas_agent()    paas_agent                       FATAL     Exited too quickly (process log may have details)
[192.168.81.240] nginx: RUNNING
发现没有启动,启动appt
[root@rbtnode1 install]# ./bkcec start appt
[192.168.81.240]20200616-104319 98   starting appt(ALL) on host: 192.168.81.240
paas_agent: started

3.2.安装bkdata报错

解决方法

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[root@rbtnode1 install]# /data/bkce/service/zk/bin/zkCli.sh -server zk.service.consul:2181 ls /common_kafka/brokers/ids
Connecting to zk.service.consul:2181
log4j:WARN No appenders could be found for logger (org.apache.zookeeper.ZooKeeper).
log4j:WARN Please initialize the log4j system properly.
log4j:WARN See http://logging.apache.org/log4j/1.2/faq.html#noconfig for more info.

WATCHER::

WatchedEvent state:SyncConnected type:None path:null
[1]

[root@rbtnode1 ~]# pip install kazoo

3.3.技巧

一般遇到上图的现象都是对应的插件没有安装,安装即可解决问题

4.注意事项

4.1.主机重启

主机重启后需要手动启动paas、cmdb、job等一系列模块

首先查一下有没有启动,如果启动了就用./bkcec stop 模块名停止在用./bkcec start 模块名启动

启动paas

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[root@rbtnode1 install]# ./bkcec start paas
[192.168.81.240]20200616-205049 98   starting paas(ALL) on host: 192.168.81.240
Unlinking stale socket /data/bkce/logs/open_paas/supervisor.sock

启动cmdb

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[root@rbtnode1 install]# ./bkcec stop cmdb
[192.168.81.240]20200616-205617 135   stopping cmdb(ALL) on host: 192.168.81.240
cmdb_hostcontroller: stopped
cmdb_hostserver: stopped
cmdb_toposerver: stopped
cmdb_objectcontroller: stopped
cmdb_webserver: stopped
cmdb_procserver: stopped
cmdb_auditcontoller: stopped
cmdb_apiserver: stopped
cmdb_eventserver: stopped
cmdb_datacollection: stopped
cmdb_adminserver: stopped
cmdb_proccontroller: stopped
Shut down
[root@rbtnode1 install]# ./bkcec start cmdb
[192.168.81.240]20200616-205626 98   starting cmdb(ALL) on host: 192.168.81.240

启动job

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[root@rbtnode1 install]# ./bkcec start job
[192.168.81.240]20200616-205129 98   starting job(ALL) on host: 192.168.81.240

启动app_mgr

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[root@rbtnode1 install]# ./bkcec status appo
[192.168.81.240] paas_agent()    paas_agent                       RUNNING   pid 19074, uptime 1:40:13
[192.168.81.240] nginx: RUNNING


[root@rbtnode1 install]# ./bkcec status appt
[192.168.81.240] paas_agent()    paas_agent                       RUNNING   pid 19074, uptime 1:41:51
[192.168.81.240] nginx: RUNNING

启动bkdata

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
[root@rbtnode1 install]# ./bkcec status bkdata

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/145300.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年5月1,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
腾讯蓝鲸自动化运维平台简介部署及常见报错解决
安装和运行蓝鲸时,模块之间互相访问的端口策略较多,建议对蓝鲸后台服务器之间关闭防火墙。
iginkgo18
2020/09/27
10.3K0
腾讯蓝鲸自动化运维平台简介部署及常见报错解决
腾讯蓝鲸智云-单机离线部署测试
新建repo配置文件:vi /etc/yum.repos.d/CentOS.repo,编辑内容如下:
Alfred Zhao
2020/03/02
7.7K0
蓝鲸:安装SaaS组件bk_monitor失败分析解决
使用./bk_install saas-o 安装发现bk_monitor(蓝鲸监控)组件报错“ERROR deploy failed: timeout”。
Alfred Zhao
2020/03/12
1.9K0
蓝鲸社区版升级(v3.1.5-->v3.1.6)
根据文章,蓝鲸社区版升级至3.1.6版本,需要先下载最新的社区版安装包,然后通过上传安装包的方式进行升级。升级过程中需要注意备份原有的配置文件,并确认所有进程是否都已停止。在升级完成后,需要启动所有服务,并确认所有进程是否正常。升级完成后,建议进行验证,以确保升级成功。
shaonbean
2018/01/02
6620
蓝鲸社区版升级(v3.1.5-->v3.1.6)
腾讯蓝鲸集群式部署
腾讯蓝鲸智云,简称蓝鲸,是腾讯互动娱乐事业群(Interactive Entertainment Group,简称 IEG)自研自用的一套用于构建企业研发运营一体化体系的 PaaS 开发框架,提供了 aPaaS(DevOps 流水线、运行环境托管、前后台框架)和 iPaaS(持续集成、CMDB、作业平台、容器管理、计算平台、AI 等原子平台)等模块,帮助企业技术人员快速构建基础运营 PaaS。
小陈运维
2021/10/13
1.1K0
腾讯蓝鲸智云运维平台单机版本部署实践
该版本包含CMDB管理、作业脚本执行、流程编排、日志检索、监控告警、 故障自愈、微服务容器管理以及持续集成(CI)等能力,助力企业技术人员快速构建一体化运维支撑以及研发效能提升的能力,推动企业数字化转型。
yuanfan2012
2022/01/25
6.7K1
腾讯蓝鲸智云运维平台单机版本部署实践
谈谈蓝鲸平台的高可扩展性和高可维护性
腾讯蓝鲸智云,作为业界领先的一套基于PaaS的技术解决方案,它提供了完善的前后台开发框架、调度引擎、公共组件等模块,帮助业务的产品和技术人员快速构建低成本、免运维的支撑工具和运营系统。 嘉为科技作为腾
嘉为蓝鲸
2019/01/16
2K0
使用CentOS7 kvm虚拟机安装蓝鲸社区版(3.15)
使用C7 kvm虚拟机安装蓝鲸平台 蓝鲸介绍 蓝鲸官网: http://bk.tencent.com/ 蓝鲸社区版本下载:http://bk.tencent.com/download/ 蓝鲸智云社区:
shaonbean
2018/01/02
1.7K0
使用CentOS7 kvm虚拟机安装蓝鲸社区版(3.15)
蓝鲸单机离线部署:app_mgr组件安装失败解决
之前在腾讯蓝鲸智云-单机离线部署测试中,遇到了几个安装问题,本文记录下3.2 app_mgr组件安装失败 的解决过程,因为这个问题卡了很久(可能也是因为笔者对python相关知识和蓝鲸产品不够熟悉),虽然最终解决了,但过程本身更值得记录。
Alfred Zhao
2020/03/08
2.2K0
单台机器安装体验蓝鲸7.1
整个过程都是根据社区文档 https://bk.tencent.com/docs/document/7.0/253/69744
腾讯蓝鲸助手
2023/08/22
1.4K0
Ansible 自动化运维笔记(总结)
Ansible 是新出现的自动化运维工具,基于Python开发,集合了众多运维工具的优点.
王 瑞
2022/12/28
2.3K0
蓝鲸平台MySQL数据库管理规范建议
MySQL作为蓝鲸平台存取数据的主要数据库,其稳定性关系到蓝鲸平台的使用体验,而其数据安全性则可能关系到企业IT资产相关信息,在安装和维护蓝鲸平台的过程中应引起足够重视。本文将对如下几个出现过的问题进行分析和提供处理建议。这几个问题分别为:升级,配置日志自动清理,binlog手动清理维护,表清空,备份。
嘉为蓝鲸
2019/05/27
2.7K0
蓝鲸平台MySQL数据库管理规范建议
蓝鲸监控社区版5.0:终结满屏告警
社区版5.0已经发布,小编和你一起看看这个迭代是如何解决用户关心的告警风暴、ZooKeeper/Kafka这类二进制名相同的进程监控、配置全局策略后,想单独给1台机器设置策略、Windows下如何做进程端口监控问题。
嘉为蓝鲸
2019/04/24
2.9K0
蓝鲸监控社区版5.0:终结满屏告警
记录-蓝鲸相关知识点
运维自动化工程师(BKOS)理论基础 运维自动化工程师(BKOS)理论基础 蓝鲸安装完成后,ssh登陆到蓝鲸的机器上会自动加载一些环境变量,这些变量是 定义在哪个文件 A. HOME/.bashrc B. HOME/.bkrc C. /etc/profile D. /data/install/.rcmdrc 正确答案:B 蓝鲸安装过程中,会使用一个标记文件来记录安装的步骤,它的路径是 A. /data/install/bk_install B. /data/install/.bk_install.st
shaonbean
2021/03/22
2.3K0
记录-蓝鲸相关知识点
自动化运维实践 | Ansible playbook重用
playbook支持两种重用机制,一种是重用静态的单个playbook脚本,另外一种是重用实现特定功能的文件夹,类似于python等编程语言中的包。
小土豆Yuki
2020/08/20
1.2K0
蓝鲸作业平台:搞定与脚本相关的一切
蓝鲸智云,简称蓝鲸,是腾讯游戏运营部“腾讯智营”下的子品牌。它是一套基于 PaaS 的企业研发运营一体化技术解决方案,提供了一个完整的研发、运维、运营的PaaS技术平台。平台提供了完善的前后台开发框架、调度引擎、公共组件等模块,帮助业务的产品和技术人员快速构建低成本、免运维的支撑工具和运营系统;是腾讯游戏运营部沉淀多年的技术运营支撑体系,承担着数百款业务线上运营的使命。
嘉为蓝鲸
2018/12/21
4.2K0
看蓝鲸标准运维如何编排一切
蓝鲸智云,简称蓝鲸,是腾讯游戏运营部“腾讯智营”下的子品牌。它是一套基于 PaaS 的企业研发运营一体化技术解决方案,提供了一个完整的研发、运维、运营的PaaS技术平台。平台提供了完善的前后台开发框架、调度引擎、公共组件等模块,帮助业务的产品和技术人员快速构建低成本、免运维的支撑工具和运营系统;是腾讯游戏运营部沉淀多年的技术运营支撑体系,承担着数百款业务线上运营的使命。
嘉为蓝鲸
2018/12/21
3.4K0
linux下安装zabbix服务器shell脚本-添加主机-邮件监控报警zabbix-自动化运维
1.手动安装,2.脚本自动安装 1.手动安装 yum install -y ntpdate # 安装时间工具 timedatectl set-timezone Asia/Shanghai # 设置时区:亚洲/上海 systemctl restart ntpdate # 重新启动ntp systemctl enable ntpdate
eisc
2020/09/21
1.2K0
【运维人的福音】腾讯蓝鲸社区版V6.0全新上线
【摘要】:腾讯蓝鲸智云,简称蓝鲸,是腾讯互动娱乐事业群的”研发、运维、运营“一体化解决方案,支撑着腾讯内部上千款业务、数十万节点服务器的稳定运行,覆盖CI(持续集成)、CD(持续部署)、CO(持续运营)的业务全生命周期。 此次发布的免费蓝鲸社区版6.0,支持企业内私有化独立部署,功能覆盖自动化运维(CMDB、运维作业平台、监控告警、故障自愈等)、运维自动化流程编排、ITSM(流程管理)、DevOps流水线及容器管理等。【注:文末附蓝鲸社区版6.0快速部署链接】 尊敬的蓝鲸智云用户:     2020
腾讯技术工程官方号
2020/11/25
1.7K0
运维思考 | 你知道CMDB与监控是什么关系吗?
企业随着业务的发展以及新IT技术的不断引入,应用系统的IT资源规模是越来越大,IT架构的复杂性也与日俱增。这种情况下,需要通过多种监控系统,不同的途径来感知业务系统活没活,活的好不好,用户体验怎样。常见的监控系统类型就包括:基础环境监控、网络监控、系统监控、数据库监控、应用监控、用户体验监控等等。
腾讯蓝鲸助手
2022/06/28
5220
推荐阅读
相关推荐
腾讯蓝鲸自动化运维平台简介部署及常见报错解决
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验