我维护了60多台服务器,理论上,我把他们分成了多个组,每个组部署不同功能的程序。可是有一天,当我要找某个程序的时候,我发现它不在它应该在的那个组中的任何一台服务器上面。但是它确实每小时又都在定时跑。那么,它到底在哪里跑?
很久以前我写过一个接口为《域名拦截实时短信邮件报警api教程》这个方法局限比较多 所以小杰选择重新编写一下这个邮件报警机制,修改为服务器发信 使用教程: 接口地址:https://
一、起因 昨天,开发组兄弟发现 resin 日志出现不少支付宝业务报错信息,用户用支付宝购买了产品,钱到账后公司系统却未返回支付成功状态! 这还得了?用户明明支付成功了,结果却显示未到账!!!必须赶紧解决,用户投诉是小,用户流失就大了!仔细分析日志后,发现是解析支付宝接口域名(mapi.alipay.com)时出现延时,导致获取不到支付成功的返回信息! 检查发现 OpenSUSE 的 nameserver 居然是谷歌的公用 DNS:8.8.8.8!!!尼玛,不出问题才怪呢! 二、解决 虽然阿里新推出了公用
当接入 Fundebug 的 JavaScript 监控插件后,我们报警识别算法会自动判断区分生产和开发环境。如果是生产环境,会触发邮件、钉钉等报警。但是测试环境往往很难和开发环境区分,比如下面的情况:
日志收集推荐使用Elastic Stack协议栈,可以满足收集海量日志需求,而且便于后续分析、报表、报警操作
大概 4 月 7 日 10:15 接到短信报警,提示腾讯云 CDN 流量耗尽。 因当时外出,就在手机上简单地检查以后,确定被攻击,暂停了 CDN 服务。
服务的稳定性和安全性是我们平时都要关注的,在服务器可用性达标的前提下,我们还要保证服务的安全性。如果服务本身已经不可用,安全性也无从谈起,再安全也不能通过拔服务器电源保证服务的安全性,安全性对可用性来说是唇寒齿亡的关系,可用性对安全性来说,是后者存在的前提。
Rainbond是一款以应用为中心的开源PaaS,由好雨基于Docker、Kubernetes等容器技术自主研发,可作为企业在公有云或私有云环境下的应用交付平台、DevOps平台、自动化运维平台和行业云平台,或作为企业级的混合云多云管理工具、Kubernetes容器管理工具或Service Mesh微服务架构治理工具。
今天有个网友联系到,说能不能做一个域名拦截实时短信报警的功能,当他问这个问题的时候我就已经想好了思路,只需要在原来《腾讯检测域名报毒的API接口》的基础上增加一个拦截域名返回301状态码的代码即可
哪吒面板是一个类似于ServerStatus的服务器状态监控程序,不过,哪吒面板相对来说功能更强大一些,哪吒监控 支持服务器系统状态监控、HTTP(SSL 证书变更、即将到期、到期)、TCP、Ping 监控报警,命令批量执行和计划任务,是一个一站式轻监控轻运维系统。
之前一个蜀国的朋友业务被DDOS攻击,业务服务被机房断网,客户单流失有经济损失,这篇具体说的就是这件事情。
11-01 12:00 中午午饭期间,手机突然收到业务网关非200异常报警,平时也会有一些少量499或者网络抖动问题触发报警,但是很快就会恢复(目前配置的报警阈值是5%,阈值跟当时的采样窗口qps有直接关系)。
内容来源:2017 年 08 月 10 日,搜狐研发中心架构师陈伟在“第二届APMCon中国应用性能管理大会”进行《搜狐服务架构优化实践》演讲分享。IT 大咖说(微信ID:itdakashuo)作为独家视频合作方,经主办方和讲者审阅授权发布。
美国加州大学伯克利分校和劳伦斯伯克利国家实验室(LBNL)的几位安全研究人员开发了鱼叉式网络钓鱼黑箱粉碎机,通过分析鱼叉式网络钓鱼攻击的根本特点设计了一组新的信誉特征。该组特征对应于鱼叉式网络钓鱼攻击的两个关键阶段,随后引入新的异常检测技术(DAS),以非参数的方式运行,不需要任何标记的训练数据,利用信誉特征来检测攻击。研究人员与LBNL的安全团队进行合作,评估了近4年的电子邮件数据(约3.7亿个电子邮件)以及相关的HTTP日志,验证其具有检测凭证鱼叉式网络钓鱼攻击的功能。强势围观后来谈谈这一鱼叉式网络钓鱼
1、 需求分析 庞大的业务访问量需要高性能、可靠的服务器框架支撑。高性能要求服务器在巨大压力下仍然高速运行,读写返回正确的业务信息,前端用户体验良好。可靠性要求服务器出现宕机、罢工等情况,可以及时恢复服务器正常工作状态,支持业务系统24小时健康运行。使用缓存、读写分离技术提高服务器访问资源速度,解决大访问量资源拥堵问题;使用负载均衡与高可用技术提高服务器响应速度以及服务器稳定性,解决服务器处理大用户量请求问题以及服务器宕机的及时恢复能力。 同时,需要部署运维监控平台,监控服务器上服务程序与资源使用情况,出现
如果上述二种方式都不满足你的需求,我建议你尝试使用XXL-JOB或其他开源调度平台。
话不多说,开始安装。Domain Admin支持pip安装,docker安装,源码安装,还有之前介绍过的1panel面板安装,在这篇文章里吗,我们依然采用的是docker的方式来安装
好多同学在收到D监控宕机通知的邮件后,发现自己网站还能访问,并没有宕机,认为这是D监控的误报。
经常见到有这样的说法,"准备购买一个服务器搭建自己的网站,但是要自己的网站能够被别人在浏览器中访问到还需要购买域名进行备案一系列的”,那么,这里的备案是指域名备案还是服务器备案呢? 感觉总会分辨不清楚!下面就来详解解释一下什么是备案。
从23:35到次日早上07:30, 偶尔收到10.205.1.26/10.205.1.27服务器报警: 告警06:57:30 on 10.205.0.1.26 项目: Zabbix agent on 10.205.1.26 is unreachable for 5 minutes 详情:Agent ping:Down (1)
随着dns隧道应用的越来越广泛,尤其是xshell事件被公布以后,各大公司纷纷启动对dns隧道的监控,参考xshell的逻辑,大多数公司采取了“监控多个终端请求异常长度域名”的检测方案,其中注重检出率
#!/bin/bash #Author: #设置变量,url为你需要检测的目标网站的网址(IP或域名) url=http://www.baidu.com
官方下载 有的时候官方下载连接会失败,所以这里选择docker镜像来进行安装部署,非常的简单
EasyCVR视频融合云服务作为功能丰富、场景应用广泛的AI视频结构化智能分析平台,目前已经融合了AI人脸识别及车牌识别的功能。除了新增的基于AI技术的智能检测与分析功能,EasyCVR在视频安防监控的功能上也日趋完善,不仅支持多种协议、多类型设备的视频流接入与分发、还可支持语音对讲、智能告警以及平台级联等功能。
Prometheus 是当下火热的监控解决方案,尤其是容器微服务架构,Kubernetes 的首选监控方案。关于为什么要用 Prometheus,我这里就不多讲,相关的文章太多了,大家也可以看看官方的说法。本文就讲讲如何自动化的搭建一套基于 Kubernetes 集群的 Prometheus 监控系统。
本文介绍如何基于腾讯云的各种云产品优雅地搭建个人网站,涉及的云产品有云服务器、SSL、企业邮箱、对象存储、CDN、云函数、API网关、云监控等。
事故现象: 下午14.52分,企业微信出现如下所示zabbix报错,显示ERP访问失败
不过,话说回来,监控系统对于任何业务来说都是重中之重,部署完成之后,除了必要的逻辑优化与更新迭代,监控与报警显得更加重要。
公司的广告业务量很大,因为微信对域名链接限制是非常严格,这就致使了外部链接域名什么的很容易在微信中跑着跑着就会被屏蔽了,但是他把你屏蔽了又不会跟你通知,这就导致经常跑了很长的时间,发现域名早就已经被屏蔽了,公司利益得到损失。 真的是挺烦的,但是域名太多了,根本没有办法一个个手动检查。后来我在网上找到了几个做微信域名检测的服务商。这里给大家分享一个好用的微信域名检测接口。
昨天看到一个信息,由于企业邮箱被挟持,骗子通过邮件和他的客户沟通,几天的时间,骗走了10几万美金的货款,而他催客户银行水单时,才发现已经过了几天了,难以追回。
过程是这样的,需要与合作方数据进行交互(肯定是不允许直接连对方数据源的),对方提供了两台server,后端同事在server上面作了proxy搭建了桥接的应用(两台server没有公网ip,通过一个超级难用的堡垒机明御进行管理)。两台server挂在在了负载均衡slb上对外提供http服务(环境为阿里云环境)。项目马上要上线了,然后就面临一个问题,如何监控这个桥接程序的健康状态呢?想到了几种方式:
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/X__Alone/article/details/80662679
在之前公司搭建测试环境过程中会安装mysql、redis、kafak等数据库,在测试环境使用过程中经常会遇到服务挂了等问题,经过分析是因为数据库无法连接成功或者数据打满等异常问题。
一个功能上线后,其实研发心里根本没底儿,不知道这个功能上线以后是不是真的没问题;有经验一些老同学还知道直接登录线上机器去tail -f php.error.log,但是对于新同学来说,基本就只能等着被通知服务故障。
早期,一直在用zabbix,不过随着业务的快速发展,以及互联网公司特有的一些需求,现有的开源的监控系统在性能、扩展性、和用户的使用效率方面,已经无法支撑了。
国标28181协议全称为GB/T28181《安全防范视频监控联网系统信息传输、交换、控制技术要求》,是由公安部科技信息化局提出,由全国安全防范报警系统标准化技术委员会(SAC/TC100)归口,公安部一所等多家单位共同起草的一部国家标准(以下简称28181)。
上面详细介绍了如何使用zabbix email形式发送报警,个人认为唯一的缺点就是报警内容太不够人性化了。所以下面介绍zabbix第二种常用的报警方式,自定义脚本的形式报警,这个自定义的脚本你可以使用邮件报警、短信报警等等。
出品 | OSC开源社区(ID:oschina2013) 2023 年 3 月 5 日晚 20:20 左右,许多网友表示在使用 B 站时,手机和电脑端都无法访问视频详情页,且手机端无法查看收藏夹与历史记录。 还有网友表示,首页能够正常加载,但全部是繁体字。 B 站上一次大规模崩溃是 2021 年 7 月 13 日,被成为「713 事故」,曾被反复拉出来“鞭尸”。 B 站技术团队在 2022 年 7 月 12 日,针对「713 事故」发了一篇技术解析的长文:2021.07.13 我们是这样崩的 202
威胁情报在国内已经火了几年,威胁情报怎么用,具体的使用场景是什么,这方面的话题似乎较少。下面想根据个人所知,谈谈这方面,不完善准确的地方也请大家指正。 有些时候情报和威胁情报很容易被划等号,其实不然。威胁情报(和攻击者相关)、漏洞情报(和脆弱点相关)、资产情报(内部IT业务资产和人的信息),都属于情报的范畴,但作用和生产维护方法都不同,需要明确区分。 它们都是安全分析需要的信息,资产和漏洞在多年前就一直被重视,甚至安全建设就是被认为是围绕着资产和漏洞的。 现实中攻防对抗的不断演进,让我们不得不进入主动安全建
yum install sysstat wget -y && wget -N --no-check-certificate https://raw.githubusercontent.com/Lcry/Command-file/master/monitor_ch.sh && chmod +x monitor_ch.sh && ./monitor_ch.sh
近年来,国内各大网站逐渐升级为HTTPS加密连接,以防止网站内容被篡改、用户数据被监听。但是一向被认为“安全可靠”的HTTPS加密传输,其实也可以被木马轻易劫持。 日前,360安全中心发现一个专门劫持主流搜索引擎和电商网站的HTTPS“劫匪”木马活跃度剧增。此木马使用“移花接木”大法,在中招电脑上导入虚假证书,以中间人攻击的方式突破HTTPS加密连接的安全防线,从而在受害用户访问一些大型网站时篡改页面插入广告。根据360网络安全研究院对全网数据的监测分析,HTTPS“劫匪”木马每天劫持的HTTPS访问量超过
为了监控到各业务的访问质量,基于LB层的Nginx日志,实现LB层到Real Server之间访问请求的响应时间(即upstream_response_time)及HTTP状态码(即upstream_status)的监控及报警。操作记录如下:
由于公司业务比较多,部署的站点也比较多。为了网站安全运行,以防故障发生时能第一时间知晓,特意编写下面监控脚本,对网站访问状态和超时时间进行监控:当code状态为5xx或者访问超时时间大于10s时进行报警。脚本脚本如下: [root@qd-inf-logcollector01 web_monit]$ pwd /app/script/web_monit [root@qd-inf-logcollector01 web_monit]$ ll total 12 -rwxr-xr-x 1 root root 870
IGTM是什么? 腾讯云智能全局流量管理(Intelligent Global Traffic Management),简称IGTM,可以帮助用户实现应用服务的高并发负载均摊、应用服务的健康检查,并能够根据健康检查结果实现故障隔离或流量切换,方便用户灵活快速的构建同城多活和异地容灾等高可用服务。 IGMT做什么? 1、主备容灾。当你为业务部署资源,既配置了电信IP,又配置了移动IP,正常情况用电信的,一旦发现电信的不通了,就启用移动的,等电信正常后,再换回到电信IP。 2、多活。 你有多个IP池同时向用户
看到这个页面说明prometheus启动成功了,默认监控了自己,我们来看一下本机的监控状态
同程旅行大数据集群从 2017 年开始容器化改造,经历了自研调度 docker 容器 ,到现在的云舱平台, 采用 Kubernetes 调度编排工具管理大数据集群服务。
Grafana 除了支持丰富的数据源和图表功能之外,还支持告警功能,该功能也使得 Grafana 从一个数据可视化工具成为了一个真正的监控利器。Grafana 可以通过 Alerting 模块的配置把监控数据中的异常信息进行告警,告警的规则可以直接基于现有的数据图表进行配置,在告警的时候也会把出现异常的图表进行通知,使得我们的告警通知更加友好。
很早之前就使用过腾讯云版本的日志服务cls。个人的应用场景主要是想采集clb负载均衡的日志。但是早些时候腾讯云的负载均衡clb只能挂载单个ssl证书,早期域名比较混乱,不想使用多个的clb服务。个人采用了自建的kubernetes服务。采用了腾讯云cls +tcp的方式代理应用,tls证书作为secret的方式交由kubernetes管理。这样就不能在clb层收集日志了(到现在也是这样仅支持http https方式收集日志,不能使用tcp方式收集)。因此仅仅是试用了一下就放弃了。
领取专属 10元无门槛券
手把手带您无忧上云