一次线上java应用响应时间过长问题的排查

最新推荐文章于 2025-03-02 14:02:31 发布

道不虚行只在人

最新推荐文章于 2025-03-02 14:02:31 发布

阅读量2.7k

点赞数 4

CC 4.0 BY-SA版权

分类专栏： java 疑难杂症文章标签： cpu高响应时间垃圾回收 gc

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xinzhongtianxia/article/details/101544986

最近接手一个老java应用，没多久接到响应时间太长的报警，整个排查过程还是挺有意思的，记录一下。
整个过程中，设计到cpu，内存，垃圾回收，引用，spring, 单例等等知识，整个下来，心情愉悦。

接到报警

吃完晚饭回来，接到报警短信，服务响应时间太长，达到2s以上。
第一反应，怎么可能，这个应用很简单，就提供了几个查询接口，QPS单机也就10左右，居然响应时间2s以上，这不科学。

看监控

看监控平台，有问题的机器，cpu占用很高，这。。。更不科学了。理论上，这应用cpu能到1%就不错了，现在居然80%，吓得我赶紧跑到机器上，top了一把，确实是java应用占用cpu很高。

找出占用cpu的线程

ps -mp pid -o THREAD,tid,time

发现cpu几乎全被一个线程占用了，将线程id转换成16进制

printf "%x\n" tid

打印线程堆栈信息

jstack pid |grep tid -A 30

看到的结果居然是，CMS垃圾收集器的线程。。。
这，这，这不科学。

垃圾回收

看垃圾回收日志，发现一直在进行Full GC，但是几乎没啥效果，GC完了，老年代依然是几乎占满的状态。
即使是CMS，也不能避免传说中的stop the world，所以响应时间变长了。
但是，现在问题来了，Full GC回收不掉的对象都是啥啥啥？

分析java堆内存

先把线上流量从这台机器切走，

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。