操作场景
在简单的运维场景下,日志通常先直接输出到服务器本地文件中,再使用 Linux 系统下常用的 grep 命令查找符合要求的日志。此方式在业务系统较为复杂时,会由于日志分散在不同的服务器、命令行操作不直观、服务器权限管理限制等原因导致日志查找困难,严重影响运维效率。当需要基于日志做一些统计分析或监控告警,更是难上加难。
本文将介绍如何快速通过 grep 命令查找的本地日志迁移至日志服务(Cloud Log Service,CLS),以获取如下优势:
数据集中存储及检索,无需登录多台服务器分别进行查询,在负载均衡、微服务等架构下尤为关键。
简单点击即可快速检索日志,告别命令行及繁琐的服务器权限管理。
基于日志进行统计分析,获取关键业务指标,例如 PV、接口响应时间、接口错误率等。
实时检测异常日志,通过短信、邮件和微信等多种方式获取通知。
说明
操作步骤
步骤1:日志采集
针对服务器本地日志,可使用 LogListener 将原始日志采集至 CLS,LogListener 安装详情请参见 LogListener 安装指南。
如果您的服务器为腾讯云云服务器(Cloud Virtual Machine,CVM),还可以通过控制台自动安装 LogListener,详情请参见 CVM 批量部署 LogListener。
与服务器本地日志不同,为了后续对日志进行更方便的检索和统计分析,在采集时可将非格式化的原始日志转换为格式化的数据。例如原始日志为:
10.20.20.10 ::: [Tue Jan 22 14:49:45 CST 2019 +0800] ::: GET /online/sample HTTP/1.1 ::: 127.0.0.1 ::: 200 ::: 647 ::: 35 ::: http://127.0.0.1/
可使用分割符
:::
切分为八个字段,并为每个字段定义名称:IP: 10.20.20.10bytes: 35host: 127.0.0.1length: 647referer: http://127.0.0.1/request: GET /online/sample HTTP/1.1status: 200time: [Tue Jan 22 14:49:45 CST 2019 +0800]
步骤2:配置索引
步骤3:检索日志
示例原始日志为:
10.20.20.10 ::: [Tue Jan 22 14:49:45 CST 2019 +0800] ::: GET /online/sample HTTP/1.1 ::: 127.0.0.1 ::: 200 ::: 647 ::: 35 ::: http://127.0.0.1/
在 CLS 对应的格式化后日志为:
IP: 10.20.20.10bytes: 35host: 127.0.0.1length: 647referer: http://127.0.0.1/request: GET /online/sample HTTP/1.1status: 200time: [Tue Jan 22 14:49:45 CST 2019 +0800]
案例1
检索 request 为/online/sample 的日志。
使用 grep 命令:
grep "/online/sample" test.log
使用 CLS 检索方式:
request:"/online/sample"
案例2
检索状态码 status 不为200的日志。
使用 grep 命令:
grep -v "200" test.log
实际上,此方式可能会把一些日志也排除掉(出现了200,但 status 不是200的字段)。如需准确检索,则需要编写正则表达式。
使用 CLS 检索方式:
NOT status:200
CLS 还支持更加灵活的检索方式,例如检索状态码 status 大于等于500的日志。
status:>=500
案例3
统计 status 不为200的日志条数。
使用 grep 命令:
grep -c -v "200" test.log
使用 CLS 检索方式:
NOT status:200 | select count(*) as errorLogCounts
案例4
检索状态码 status 为200,且 request 为 /online/sample 的日志。
使用 grep 命令:
grep "200" test.log | grep "/online/sample"
使用 CLS 检索方式:
status:200 AND request:"/online/sample"
案例5
检索 request 为 /online/sample 或 /offline/sample 的日志。
使用 grep 命令:
grep -E "/online/sample|/offline/sample" test.log
使用 CLS 检索方式:
request:"/online/sample" OR request:"/offline/sample"
案例6
检索 request 为 /online/sample,但日志文件不是 test.log 的日志。
使用 grep 命令:
grep -rn "/online/sample" --exclude=test.log
使用 CLS 检索方式:
request:"/online/sample" AND NOT __FILENAME__:"test.log"
案例7
检索 time 为 [Tue Jan 22 14:49:45 CST 2019 +0800] 的日志的前10行日志。
使用 grep 命令:
grep "[Tue Jan 22 14:49:45 CST 2019 +0800]" -B 10 test.log
使用 CLS 检索方式:
time:"[Tue Jan 22 14:49:45 CST 2019 +0800]"