前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >记一次 JVM CPU 使用率飙高问题的排查过程

记一次 JVM CPU 使用率飙高问题的排查过程

作者头像
CG国斌
发布2022-05-06 10:12:05
8410
发布2022-05-06 10:12:05
举报
文章被收录于专栏:维C果糖维C果糖

文章目录

问题现象

首先,我们一起看看通过 VisualVM 监控到的机器 CPU 使用率图:

cpu-usage
cpu-usage

如上图所示,在 下午3:45 分之前,CPU 的使用率明显飙高,最高飙到近 100%,为什么会出现这样的现象呢?

排查过程

Step 1:使用top命令,查询资源占用情况:

top
top

如上图所示,显示了服务器当前的资源占用情况,其中PID5456的进程占用的资源最多。

在这里,我们也使用top -p PID命令,查询指定PID的资源占用情况:

top-p
top-p

Step 2:使用ps -mp PID -o THREAD,tid,time命令,查询该进程的线程情况:

ps
ps

在这里,我们也使用ps -mp PID -o THREAD,tid,time | sort -rn命令,将该进程下的线程按资源使用情况倒序展示:

ps-sort
ps-sort

Step 3:使用printf "%x\n" PID命令,将PID转为十六进制的TID

printf
printf

在这里,我们之所以需要将PID转为十六进制是因为在堆栈信息中,PID是以十六进制形式存在的。

Step 4:使用jstack PID | grep TID -A 100命令,查询堆栈信息:

jstack
jstack

如上图所示,显示该进程下多个线程均处于TIMED_WAITING状态。

虽然线程处于WAITING或者TIMED_WAITING状态都不会消耗 CPU,但是线程频繁的挂起和唤醒却会消耗 CPU,而且代价高昂。

而上面之所以会出现 CPU 使用率飙高的情况,则是因为有人在做压测。

特别地,在 mock 底层接口的时候,使用了类似TimeUnit.SECONDS.sleep(1)这样的语句。

至于为何在 下午3:45 分之后,CPU 的使用率降下来了,则是因为停止了压测。

除此之外,我们还可以使用jinfojstat命令来查询 Java 进程的启动参数以及 GC 情况:

  • 使用jinfo PID命令,查询启动参数:
jinfo
jinfo

如上图所示,使用该命令我们主要是为了查询启动参数,如初始化堆大小、垃圾回收器等配置。

  • 使用jstat -gcutil PID 1000命令,查询 GC 情况:
jstat
jstat

如上图所示,显示了PID20567的 Java 进程每秒的 GC 情况,其中1000表示 GC 状态的更新频率,单位为毫秒。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020-04-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 文章目录
  • 问题现象
  • 排查过程
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档