Java 应用线上问题排查思路、常用工具小结
生活随笔
收集整理的這篇文章主要介紹了
Java 应用线上问题排查思路、常用工具小结
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
前言
本文總結(jié)了一些常見的線上應(yīng)急現(xiàn)象和對應(yīng)排查步驟和工具。分享的主要目的是想讓對線上問題接觸少的同學有個預先認知,免得在遇到實際問題時手忙腳亂。畢竟作者自己也是從手忙腳亂時走過來的。
只不過這里先提示一下。在線上應(yīng)急過程中要記住,只有一個總體目標:盡快恢復服務(wù),消除影響。不管處于應(yīng)急的哪個階段,我們首先必須想到的是恢復問題,恢復問題不一定能夠定位問題,也不一定有完美的解決方案,也許是通過經(jīng)驗判斷,也許是預設(shè)開關(guān)等,但都可能讓我們達到快速恢復的目的,然后保留部分現(xiàn)場,再去定位問題、解決問題和復盤。
在大多數(shù)情況下,我們都是先優(yōu)先恢復服務(wù),保留下當時的異常信息(內(nèi)存dump、線程dump、gc log等等,在緊急情況下甚至可以不用保留,等到事后去復現(xiàn)),等到服務(wù)正常,再去復盤問題。
好,現(xiàn)在讓我們進入正題吧。
常見現(xiàn)象:CPU 利用率高/飆升
場景預設(shè):
監(jiān)控系統(tǒng)突然告警,提示服務(wù)器負載異常。
預先說明:
CPU飆升只是一種現(xiàn)象,其中具體的問題可能有很多種,這
總結(jié)
以上是生活随笔為你收集整理的Java 应用线上问题排查思路、常用工具小结的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 你是一个合格的数据分析师吗?教你如何提升
- 下一篇: SpringBoot 源码解析 —— S