Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >CPU飙升怎么办?

CPU飙升怎么办?

作者头像
测试开发技术
发布于 2023-10-09 07:19:49
发布于 2023-10-09 07:19:49
33300
代码可运行
举报
文章被收录于专栏:测试开发技术测试开发技术
运行总次数:0
代码可运行

01

线上服务器CPU飙升,如何定位到Java代码

解决这个问题的关键是要找到Java代码的位置。下面分享一下排查思路,以CentOS为例,总结为4步。

第1步,使用top命令找到占用CPU高的进程。

第2步,使用ps –mp命令找到进程下占用CPU高的线程ID。

第3步,使用printf命令将线程ID转换成十六进制数。

第4步,使用jstack命令输出线程运行状态的日志信息。

下面详细介绍每一步的操作。

第1步,在使用top命令之后,可以看到一个列表,其中包含PID(进程ID)、USER(操作用户)、CPU占用率、内存占用率、TIME+(运行时间)、COMMAND(运行命令)等信息。一般默认按CPU占用率从上到下降序排列,如下图所示。

我们找到COMMAND列是java的这一行,说明这个程序就是用Java编写的。然后,用记事本记下这一行的PID,也就是进程ID。

第2步,使用ps -mp命令,输出这个PID下面的线程运行情况列表,如下图所示。

在这个列表中包含了几个关键字段,比如CPU占用率、TID(线程ID)、TIME(运行时间)等。在这个列表中找到CPU占用最高的线程,记下TID,也就是线程ID。

前面记下的TID是一个十进制数,不能直接使用,需要转化为十六进制数。

第3步,使用 printf 命令将TID转换为十六进制数,如下图所示。

这样就得到了真正占用CPU过高的线程ID。

第4步,使用jstack命令输出线程的具体运行日志,如下图所示。

jstack有3个参数,第1个参数是前面记下的 PID,之后加上 grep,紧跟着是转成十六进制数的TID,最后加上 –A和一个数字,这个数字表示输出日志的行数,至此就可以直接打印出具体的异常信息了。

如果日志信息比较多,异常内容比较复杂,则可以把这些异常信息输出到一个 txt文件中,慢慢分析。只需要在 jstack命令的最后追加 txt 文件名就可以了。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
jstack PID | grep TID -A60 >> error_log.txt

面试点评:从这个问题来看,面试官主要考查求职者的实操能力,以及解决问题的思路。如果求职者没有实操过,但是知道导致 CPU 飙升的原因,并说出解决思路,那么通过面试是没问题的。


02

生产环境服务器变慢,如何诊断处理

生产环境服务器变慢主要涉及3个维度:CPU利用率、磁盘I/O效率、内存瓶颈。

1. CPU利用率

CPU利用率过高或者CPU利用率过低,都会影响程序的处理效率。CPU利用率过高,说明当前服务器要处理的指令比较多,当CPU忙不过来的时候,指令的运行效率自然就会下降,用户的感受就是程序响应变慢了。

针对这个问题,我们可以使用top命令查询当前系统中占用CPU过高的进程,并定位到这个进程中比较活跃的线程。再通过jstack命令打印当前虚拟机的线程快照,根据快照日志排查问题代码。

如果CPU利用率过低,则说明程序资源使用不够,可以增加线程数量提升程序性能。

2. 磁盘I/O效率

在程序运行过程中会直接或者间接涉及一些与磁盘I/O相关的操作,比如程序直接读/写磁盘或者程序依赖的第三方组件对磁盘进行持久化存储,此时磁盘I/O效率就会对程序运行效率产生影响。

针对这种情况可以使用iostat命令查看,如果磁盘负载较高,可以针对性地进行优化。比如,借助缓存系统,减少磁盘I/O次数;用顺序写替代随机写入,减少寻址开销;使用mmap替代read/write,减少内存拷贝次数。另外,磁盘I/O效率可以通过CPU与负载的非线性关系体现出来。当负载增大时,系统吞吐量不能有效增大,CPU不能线性增长,则很可能是磁盘I/O出现阻塞。

3. 内存瓶颈

内存作为一块临时存储数据的组件,所有CPU运行的指令都需要从内存中去读/写。内存的合理使用可以减少应用和磁盘的I/O频率,减少网络I/O的频率,极大地提升I/O性能。

JVM对内存的合理分配,能够避免频繁的YGC和FULL GC。当内存使用率较高时,可以用dump命令查出JVM堆内存,用MAT工具进行分析,查出大对象或者占用内存最多的对象,以及排查是否存在内存泄漏的问题。如果用 dump 命令查出的堆内存文件正常,则可以考虑是堆外内存被大量使用导致出现问题,此时需要借助操作系统的pmap命令查出进程的内存分配情况。如果CPU和内存使用率都很正常,那么就需要进一步开启GC日志,分析用户线程暂停的时间、各部分内存区域GC次数和时间等指标,这里可以借助jstat命令或可视化工具GCEasy等。如果问题出在GC上,则考虑是不是内存不足,然后根据垃圾对象的特点进行参数调优,使用更适合的垃圾收集器,用jstack命令分析各个线程的状态。如果问题比较隐蔽,则考虑是否开启JMX,使用 visualmv 等可视化工具进行远程监控与分析。

面试点评:这个问题涉及的知识面比较多,如果只是站在求职者的角度来分析,则可以这样回答。如果你没有实际解决过类似问题,则可以说一下自己的思路,只要大体思路和方向是对的,那么在遇到类似问题的时候,可以利用网络上的资料去逐步尝试解决。

03

线上接口负载剧增,快扛不住了,你的首选方案是什么

遇到这样的问题,我们的第一反应应该是增加缓存。因为,增加缓存是解决系统性能问题最快速、最高效的方案,它能够快速提升系统的线性吞吐量,效果也最为明显。这就相当于是用空间来换取时间。曾经有人说过,缓存是解决性能问题的万金油,哪里存在性能瓶颈,就往哪里加缓存。

但是程序都已经上线了,增加缓存还来得及吗?因为在增加缓存时需要改代码,所以,临时解决方案就是增加节点。随后,将程序紧急部署到新的节点上,在流量入口增加限流和分发。但是增加节点自然会增加成本,所以增加缓存才是最优的解决方案。

缓存的设计思想在架构设计中十分常见。比如我们每天用的操作系统,不管是WindowsLinux,还是Mac OS都有系统缓存、用户缓存。磁盘有磁盘缓存区、CPU有CPU缓存区。再比如,在我们常用的经典框架中,也经常使用到缓存,Spring有IoC缓存,MyBatis有一级缓存、二级缓存。在架构设计中,可以说缓存无处不在。

因此,当并发量过高扛不住的时候,可以优先采用缓存来缓解负载压力。比如将读取频繁的数据写到缓存中,将动态页面静态化。在加上缓存之后,如果负载压力依然过大,则再考虑增加限流策略,比如消息队列;如果在增加限流后还是压力过大,则再考虑增加服务器节点。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-10-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 测试开发技术 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Java经典面试解析:服务器卡顿、CPU飙升、接口负载剧增
解决这个问题的关键是要找到Java代码的位置。下面分享一下排查思路,以CentOS为例,总结为4步。
Java3y
2023/08/22
5080
Java经典面试解析:服务器卡顿、CPU飙升、接口负载剧增
如何定位当生产环境CPU飙升的时候的问题
在当今的信息化时代,计算机系统在各行各业都发挥着重要的作用。然而,当生产环境中的CPU飙升时,系统性能会受到影响,甚至导致整个系统瘫痪。这不仅会对企业造成经济损失,还会对用户体验造成严重影响。因此,如何定位并解决生产环境中CPU飙升的问题,已成为众多企业和开发人员亟待解决的问题之一。
绿毛龟
2024/01/19
4180
如何定位当生产环境CPU飙升的时候的问题
Linux服务器如何快速定时CPU占用高的线程
最近遇到一个生产环境,一个程序因为代码写的有问题,导致CPU占用很高,所以需要马上排查问题,首先要先找出哪个程序,具体代码在哪里,所以需要借助jstack、jmap这些命令来定位具体的线程,查看具体的线程堆栈信息
SmileNicky
2024/12/23
3950
Linux服务器如何快速定时CPU占用高的线程
面试官必问:CPU 100%该如何处理?
CPU占用率突然飙升是技术人员常遇到的一个棘手问题,它是一个与具体技术无关的普遍挑战。
程序员江小北
2024/06/29
2980
面试官必问:CPU 100%该如何处理?
如何诊断处理生产环境服务器变慢
在当今的高科技环境下,生产环境服务器的性能问题可能是一个复杂且棘手的问题。当服务器变慢时,可能会对企业的运营产生重大影响,包括客户满意度下降,工作效率降低,甚至可能导致整个系统崩溃。为了解决这些问题,我们需要深入了解生产环境服务器变慢的原因,并掌握有效的诊断和处理方法。
绿毛龟
2024/01/19
2020
Java 服务遇到线上问题怎么办?这样排查很赞!
线上问题不同于开发期间的 bug,与运行时环境、压力、并发情况、具体的业务相关。对于线上的问题利用线上环境可用的工具,收集必要信息 对定位问题十分重要。
码农架构
2020/10/29
1.3K0
Java 服务遇到线上问题怎么办?这样排查很赞!
系统运行缓慢,CPU 100%,以及Full GC次数过多问题的排查思路
处理过线上问题的同学基本上都会遇到系统突然运行缓慢,CPU 100%,以及Full GC次数过多的问题。当然,这些问题的最终导致的直观现象就是系统运行缓慢,并且有大量的报警。本文主要针对系统运行缓慢这一问题,提供该问题的排查思路,从而定位出问题的代码点,进而提供解决该问题的思路。
芋道源码
2019/06/21
1.1K0
系统运行缓慢,CPU 100%,以及Full GC次数过多问题的排查思路
因死循环导致CPU飙升到100%的问题排查记录
突然收到运维告警邮件,线上的一台负责处理定时任务的服务器CPU飙升到了100%,立马放下手头工作开始了紧张的排查工作。
翎野君
2023/05/12
8300
CRUDBoy成长计划(6)— CPU100%优秀笔记汇总
根据 top 命令,发现测试环境 PID 为 5989 的 Java 进程占用 CPU 高达 100%, 疑似故障。但是,怎么定位到具体线程或者代码呢?
鹿老师的Java笔记
2022/01/20
2990
CRUDBoy成长计划(6)— CPU100%优秀笔记汇总
linux服务器性能问题相关排查手册(总结向)
定义:平均负载是指单位时间内,系统处于可运行状态和不可中断状态的平均进程数,也就是平均活跃进程数,和 CPU 使用率并没有直接关系。换言之,要计算 CPU 负载的值,只考虑正在运行或等待分配 CPU 时间的进程。不考虑正常的休眠过程(休眠状态),僵尸或停止的过程。
scarlett学习手册
2019/12/13
2.3K0
记一次线上Java程序导致服务器CPU占用率过高的问题排除过程
使用top命令查看资源占用情况,发现pid为14063的进程占用了大量的CPU资源,CPU占用率高达776.1%,内存占用率也达到了29.8%
会跳舞的机器人
2018/09/21
2.2K0
记一次线上Java程序导致服务器CPU占用率过高的问题排除过程
Java线上问题排查思路及Linux常用问题分析命令学习
之前线上有过一两次OOM的问题,但是每次定位问题都有点手足无措的感觉,刚好利用星期天,以测试环境为模版来学习一下Linux常用的几个排查问题的命令。 也可以帮助自己在以后的工作中快速的排查线上问题。
一枝花算不算浪漫
2018/12/25
1.3K0
谈谈Tomcat占用cpu高的问题
测试环境tomcat进程占用CPU一直持续99%,但是通过jstack查看log,也没有任何线程死锁的情况。 此时通过$catalina_home/bin/shutdown.sh脚本无法正常停止tomcat。
编程随笔
2020/03/24
3.1K0
cpu使用率过高和jvm old占用过高排查过程
占用cpu过高的线程有两个,其中一个是打印异常日志的(会new 对象),还有gc线程
每天晒白牙
2020/08/21
2.7K0
cpu使用率过高和jvm old占用过高排查过程
服务器CPU飚高排查
当正在运行的Java服务导致服务器的CPU突然飙高时,我们该如何排查定位到哪个接口的哪行代码导致CPU飙高的问题呢?我主要提供两个方案:
关忆北.
2023/10/11
4740
服务器CPU飚高排查
服务器常见问题排查(一)——CPU占用高、上下文频繁切换、频繁GC
该命令将显示包含nid的堆栈信息。注意,这里使用了grep命令来过滤输出结果,只显示包含nid的部分。-C5表示在匹配项前后各显示5行上下文信息,--color则用于在输出中添加颜色标记。
遥遥知识库
2023/10/26
1.3K1
服务器常见问题排查(一)——CPU占用高、上下文频繁切换、频繁GC
网易二面:CPU狂飙900%,该怎么处理?
星球一位小伙伴面试了 网易,遇到了一个 性能类的面试题:CPU飙升900%,该怎么处理?
码猿技术专栏
2023/05/01
7771
网易二面:CPU狂飙900%,该怎么处理?
Tomcat进程占用CPU过高怎么办?
最重要的是找到哪些线程在消耗CPU,通过线程栈定位到问题代码 如果没有找到个别线程的CPU使用率特别高,考虑是否线程上下文切换导致了CPU使用率过高。
JavaEdge
2021/10/18
2.2K0
记一次 JVM CPU 使用率飙高问题的排查过程
如上图所示,在 下午3:45 分之前,CPU 的使用率明显飙高,最高飙到近 100%,为什么会出现这样的现象呢?
CG国斌
2020/04/14
5.4K0
记一次 JVM CPU 使用率飙高问题的排查过程
排查CPU利用率高的线程
在日常工作中,我们有时候需要排查线上问题,找出系统中CPU利用率最高的线程.当然,我们这里默认被排查的线程在JVM中,而不是其他非JVM的线程.
书唐瑞
2022/06/02
9260
推荐阅读
相关推荐
Java经典面试解析:服务器卡顿、CPU飙升、接口负载剧增
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档