oracle 运维案例,运维注意事项及案例讲解(个人心得)
應客戶要求,需要寫一篇《數據庫運維注意事項和案例講解》,正好自己也可以把近來這段時間中碰到的運維問題總結一下。同時也分享給大家。記之
----------------------
1.數據庫運維工作目標
數據庫的運維工作目標是保證服務范圍內的數據庫正常運行,用好、管好現有的已交付數據,在數據生命周期中,達到數據庫安全性、可用性、可靠性等幾個目標。
2. 數據庫運維工作范圍
數據庫運維范圍主要是管理維護數據庫,在數據庫出現異常的時候,有時往往是應用人員或者部門提出查詢緩慢、或者不能正常使用等問題,有時可能原因出在使用人員的客戶端機器或者網絡部分,比如有以下情況出現:
同一部門或者同一應用使用者沒有問題,但有個別應用人員提出應用不能正常使用的現象。原因可能如下:
1)原來使用正常,但是安裝其他的安全軟件,屏蔽了數據庫連通的端口,導致應用不能使用。
2)所在的網絡終端可能出現問題,使用ping命令,查看是否有丟包現象。
3)開始能正常使用,但是有個長時間的處理之后,整個應用就不能用了,有可能是因為某些軟件對應用端口的使用做了超時連結控制的結果。
根據以上的一些情況,首先要判斷問題出現在哪個環節,然后再進行數據庫的處理,當然對于數據庫服務器問題,查看alter日志是最有效和直接的,因為一旦是數據庫服務器出現問題,在alter日志中都會有記錄。
3. ?數據庫運維工作內容及相關案例
數據庫運維工作內容很多,從工作內容復雜性和常用性方面可以分為日常運維管理、高級運維管理,從達到目標分安全性、可用性、可靠性方面,具體內容如下。
3.1. 安全性
安全性包括數據訪問安全和數據安全備份恢復方面的工作。
1.數據安全訪問
作為數據庫訪問安全,主要是對于數據庫用戶及其權限的管理工作。訪問計算機系統時需要遵循的重要的安全原則是“最小權限”原則(即用戶應當只擁有執行其任務所需的最小權限,并且禁止所有未被特別允許的權限)。Oracle數據庫遵循了最小權限原則,在默認情況下,只有用戶SYS和SYSTEM才擁有所有權限.其他用戶甚至都無法連接數據庫。采用一些安全策略來對用戶的權限進行管理,比如:更改dba用戶名,禁用sys和system用戶等。
其次可以采用審計功能來提高數據訪問安全的審計倒查來防范一些非法訪問或者非法操作等。
2.數據安全備份恢復
數據安全備份恢復主要采用Rman對數據庫進行增量備份恢復策略,并有計劃的進行恢復測試,以便保證數據備份文件的有效性。或者采用DataGuard進行實時數據保護等。這些一般是數據庫大級別的安全備份恢復,作為日常工作中,對于一個重要表進行操作時,還是需要進行表級備份的,這樣才能做到數據的安全性,不至于出現數據誤刪或者誤更新操作。但是目前已經有flashback閃回操作,也能增加其數據的安全性。方法很多,但是重在數據安全意識。
3.2.可用性
數據庫可用性的日常維護包括很多,如:系統的可用磁盤空間、表空間的可用空間監控、回滾表空間、臨時表空間的監控、在線redo監控、歸檔日志監控清理、對象的有效性等,如果后期用ASM進行管理,還要監測ASM的可用磁盤空間,并考慮其不同數據的增量,預估出表空間和磁盤大小,及時擴展,以便避免因為表空間或者磁盤空間不足而導致的數據庫問題。
案例1:由于沒有及時清理歸檔日志導致磁盤空間耗盡,引起數據庫掛起。
案例2:由于沒有及時擴展表空間,導致數據無法增加和插入,引起應用異常。
案例3:由于redo日志過小或者日志組過少,導致redo日志切換過快,引起應用數據插入和更新。
案例4:由于磁盤或者ASM空間耗盡,引起數據庫服務掛起。
案例5:由于數據庫對象失效,或者索引失效,引起應用無法正常使用,或者查詢數據響應緩慢的問題。
3.3. 可靠性
可靠性是指數據庫能不間斷的運行,即使是做其他數據處理的時候也能保證數據庫的正常使用,這樣就要保證數據的安全性和實例的有效性,oracle rac和oracle dataguard提供了這一功能。
在對于可靠性的維護方面,一般是在oracle RAC環境下進行維護的,其中包括了cluster的維護和數據庫實例以及ASM實例的維護。
3.4. 故障排除
針對故障排除方面,遵循以下思路,一般故障出現之后,在alter日志中都有記錄,根據alter日志中的錯誤號和提示信息,來判定數據庫出現的錯誤是什么,定位錯誤環節:數據庫整體環節(如:redo、archivelog、undo表空間、temp表空間、session等)、應用環境(如是否是存儲過程問題、或者觸發器、視圖等)或者是系統級問題。定位好問題之后再做進一步處理。
3.5. 故障分析及解除總結
略。。。總結自己這段時間遇到的ORA-XXX錯誤信息和分析思路、解決方法。
4. 日常運維管理任務及知識點
4.1. 日常運維管理任務
序號
工作內容
周期
備注
1
確認所有的INSTANCE狀態正常
日
2
檢查文件系統的使用(剩余空間)
日
3
檢查日志文件和trace文件記錄
日
4
檢查數據庫當日備份的有效性
日
5
檢查數據文件的狀態
日
6
檢查表空間的使用情況
日
7
檢查剩余表空間
日
8
監控數據庫性能
日
9
檢查數據庫系統性能
日
10
日常出現問題的處理
日
11
監控數據庫對象的空間擴展情況
周
12
監控數據量的增長情況
周
13
系統健康檢查
周
14
檢查無效的數據庫對象
周
15
Analyze Tables/Indexes/Cluster
月
16
檢查表空間碎片
月
17
尋找數據庫性能調整的機會
月
18
數據庫性能調整
月
19
提出下一步空間管理計劃
月
4.2. 相關知識點
日常運維需要了解的知識點也比較多,具體如下:
序號
知識點
基本
具體工作
1
ORACLE數據庫部署
日常
2
ORACLE數據庫創建
日常
3
ORACLE SQL語言
日常
4
ORACLE體系架構
日常
5
ORACLE用戶管理
日常
6
ORACLE實例管理
日常
7
ORACLE數據文件數據塊
日常
8
ORACLE對象管理
日常
9
ORACLE UNDO表空間管理
日常
10
ORACLE在線歸檔日志維護管理
日常
11
ORACLE安全管理
日常
12
ORACLE RMAN基本備份恢復
日常
13
ORACLE數據庫閃回
日常
14
ORACLE DATAPUMP
日常
15
ORACLE數據庫升級
中級
16
ORACLE數據庫遷移(涵蓋ORACLE ASM磁盤組之間數據庫的遷移)
中級
17
ORACLE數據庫日常
中級
18
備份策略制定和備份恢復
中級
19
ORACLE數據庫壞塊修復
中級
20
ORACLE數據庫數據塊編輯
中級
21
ORACLE數據庫日常健康檢查
中級
22
ORACLE數據庫日常性能巡檢
中級
23
ORACLE數據庫日常運維監控
中級
24
ORACLE高并發和高可用即
高級顧問
25
ORACLE REAL APPLICATION CLUSTERS和ORACLE DATAGUARD,
高級顧問
26
做為集中數據庫運維監控的ORACLE GRID
高級顧問
27
ORACLE數據倉庫
高級顧問
28
ORACLE高并發與高可用綜合應用
高級顧問
29
ORACLE高級安全設計
高級顧問
30
ORACLE SQL優化
高級顧問
31
ORACLE性能優化
高級顧問
32
ORACLE數據庫系統綜合并發壓力測試
高級顧問
總結
以上是生活随笔為你收集整理的oracle 运维案例,运维注意事项及案例讲解(个人心得)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: oracle经典博客,Oracle启动步
- 下一篇: 获取oracle 表字段描述,几种获取o