故障管理流程与故障管理功能开发的设计
生活随笔
收集整理的這篇文章主要介紹了
故障管理流程与故障管理功能开发的设计
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
故障管理流程的設計目標
在最短時間內恢復服務正常運營,滿足SLA要求,將事件對業(yè)務運營的負面影響降至最低。故障管理功能的開發(fā)需求
故障事件的范圍
故障事件的處理需要有時限管理和故障升級處理
故障模型的定義與使用
對常見故障預定義故障處理模型,故障模型需要包括:故障管理流程圖
故障管理流程中的主要活動
1、故障確認 從各種途徑反饋來的事件中分析、判斷,以確認是否屬于故障(事件管理、web界面、用戶反饋、電子郵件等途徑)。 故障事件需要指定一個負責人,對故障事件的全生命周期的管理負責。 2、故障記錄 所有故障均需要做完整記錄并帶有時間戳。 故障記錄的定義需要包括:- 唯一參考編號
- 故障類型
- 故障緊急度
- 故障影響度
- 故障優(yōu)先級
- 記錄的日期/時間
- 記錄事件的人員
- 通知方法
- 受影響客戶的聯(lián)系方法
- 癥狀描述
- 故障狀態(tài)
- 相關配置項(應用、主機、機房、服務SLA)
- 負責故障的支持人員/小組
- 相關問題/已知錯誤
- 解決故障采取的活動
- 解決日期/時間
- 關閉類型
- 關閉日期和時間
- 硬件->服務器->內存條->插槽松動
- 軟件->應用服務->OA套件->考勤系統(tǒng)
5、初步診斷與處理 應盡量成功解決并關閉故障。 6、故障升級 當故障處理已經超過目標解決時間,或者超出自己處理范圍,必須立即升級故障。
- 職能性升級,在業(yè)務應用、系統(tǒng)、網絡等專業(yè)分組間升級故障;
- 管理性升級,當故障性質嚴重、需要引入額外資源或發(fā)生故障分配爭議時,必須通知運維負責人。
- 應確?;謴痛胧┙涍^了可靠地驗證測試;
- 可能需要協(xié)調多個小組的恢復活動并與所有參與方保持聯(lián)系;
- 需要將采取的各種措施更新至故障處理記錄中;
- 問題解決小組應將故障恢復結果反饋給該故障事件負責人,以執(zhí)行故障關閉操作。
- 故障分類,故障初始分類是否正確或需要得到更新;
- 用戶滿意度調查,對約定比例的故障事件進行;
- 故障登記,是否完備;
- 是否屬于重復發(fā)生的故障;
- 正式關閉故障。
故障管理流程相關的監(jiān)控指標(基于故障記錄的統(tǒng)計分析)
以下KPIs指標應得到監(jiān)視和報告,據(jù)以判斷故障管理流程及其運營的效率和效果。- 故障總數(shù)量
- 按產品服務統(tǒng)計的故障數(shù)量和百分比
- 故障數(shù)量的同比、環(huán)比展示
- 按各階段細分的故障,如進行中的、已關閉的等
- 重大故障的數(shù)量和百分比
- 在約定響應時間內處理的故障比例
- 重開的故障數(shù)量和百分比
- 每個人員處理的故障數(shù)量和百分比
- 按故障模型處理的故障數(shù)量和百分比
其它故障管理功能需求
- 故障自動關閉功能:啟用該功能后,該故障事件在持續(xù)一個指定的時間段后,會自動關閉,并且把故障關閉類型標識為“自動關閉”。
- 重開故障功能:在一個限定的時間內,故障重復發(fā)生,需要重開不久前關閉的故障,繼續(xù)按同一故障事件進行維護。
總結
以上是生活随笔為你收集整理的故障管理流程与故障管理功能开发的设计的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: rain、rainy、raining的区
- 下一篇: 局域网聊天程序 ——灵活使用winsoc