数据库相关的系统巡检参考项
當然公司層面也有一些巡檢要求,我自己也總結了一下,發現還是需要寫一部分,然后不斷完善。主要分為下面的幾個部分來闡述。
檢查ILO可用性和使用情況
??? 如果擁有對服務器資源的管理權限,對于ILO還是要驗證一下,大體有幾種情況。
ILO模塊沒有開啟
這個可以聯系系統組的同學幫你開啟,也可以參考下面的步驟。
??? # modprobe ipmi_watchdog
??? # modprobe ipmi_poweroff
? ??# modprobe ipmi_devintf
??? # chkconfig? ipmi? on
ILO密碼錯誤
??? 可以使用下面的命令來重置密碼
???? /usr/bin/ipmitool user set password 2 'xunjian'
ILO超過最大用戶連接數限制
???? 如果用戶名,密碼正確,如果上一次登錄沒有正常退出,可能會有下面的報錯。
???? RAC0218:已達到用戶會話的最大數
??? 這個時候可以重啟ILO來達到目標。
?? ?????ipmitool mc reset cold,這個過程會持續幾分鐘。
ILO在不同的硬件產品版本和瀏覽器的兼容性 ??
?? ILO在不同的硬件產品版本中瀏覽器也有一些使用差異,有些版本使用IE低版本可以,有些可以使用chrome,firefox,有些則不適用。
ILO頁面和JAVA的版本關系
?? 這兩點比較微妙,但是在實際中碰到問題的時候更多,特別是對于Java,如果查看新版本的硬件,JAVA8是不推薦的,因為安全策略太高,手工還修改不了這個設置,得用JAVA7及以下的版本了。
操作系統版本
?? 操作系統的版本也需要提前規劃,如果有些服務的版本過舊,需要考慮升級到一個較新的穩定版本,目前來看6U5還是值得推薦。在redhat5及以下的版本,碰到了不少的小問題。
操作系統內核參數
操作系統內核參數可以作為一個重要的檢查項,當然對于主庫而言可能重啟不現實,但是提前準備好,在下次重啟的時候能夠省事省力,對于備庫而言,也可以提早準備。
檢查操作系統防火墻情況
??? 對于操作系統中的防火墻設定最好能夠提供完整的備份,到時候可以在災備切換的時候用到。
??? 如果存在特殊的網絡設置情況,需要提前標注,要不幫你處理問題的同事會踩到一大坑。
系統文件權限
??? 對于部分文件,需要考慮文件的權限,保證不會惡意篡改。比如設定這些關鍵文件和配置文件的只讀權限,比如/etc/passwd,/etc/shadow,/etc/group等等
swap使用情況
???? swap的監控還是比較重要,對于Oracle來說,還是大SGA建議開啟大頁,要不swap爭用較高,如果剩余內存不足,很容易觸發oom-killer
文件的分區和規劃情況
??? 對于文件的分區和使用情況也需要格外關注,對于一些過舊的歷史文件可以壓縮或者刪除。是否還在使用很陳舊的文件系統。
硬盤壞塊和硬盤問題
???? 硬盤壞塊和硬盤問題還是很重要,只是硬盤沒問題,哪怕其它的硬件問題規避不了,數據至少還是沒問題的。
查看crontab的執行情況
??? 查看例行的執行任務是否正常,比較尷尬的是crontab運行了,但是什么都沒有干,比如刪除歸檔,發現一直在掃描一個空目錄,而真正的歸檔目錄已經快撐爆了。
備份保留情況,是否有異機備份
?? 這個需要結合目前的系統使用情況,如果數據庫是非歸檔,測試環境,可以考慮異機備份。對于一些關鍵業務,在有災備的情況下,也可以額外增加部分的邏輯備份。?
時間同步設置ntp
使用nftp同步時間的部分需要考慮。總結
以上是生活随笔為你收集整理的数据库相关的系统巡检参考项的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 绘图中的drawRect
- 下一篇: java信息管理系统总结_java实现科