数据中心的运维管理原则(二)
隨著大數據分析以及人工智能技術的應用,使得數據呈現爆發式增長,這也促使了數據中心的數量和規模成幾何倍數增長。相信在數據中心基礎設施部門運維工作者,應該都能體會到設備對運行環境要求苛刻,試想一下,在一個擁上萬臺甚至數十萬臺服務器的數據中心,如何保證這些設備安全可靠而有序地運行,有必要制定一套完善的機房設備管理制度。?
一、設備進場登記管理
動力設備和空調設備的質量好壞,是保證IT設備運行環境舒適性的關鍵,進而也影響了數據中心運行生命周期的長短。因此,在設備采購前期務必做好服務商資質的審查(后續同類設備采購,盡量邀請同一批服務商競標),保證關鍵設備的質量要求。
設備在正式進場后,機房的配電系統、UPS系統、柴油發電機系統、照明系統以及機房空調和新風系統應該有數據中心專人負責運維(包括各類子系統的健康檢查、巡檢、故障設備的更換以及事后設備清單統計和故障原因分析)。如果屬于合作協議約定范圍內的設備或原廠商及其代理服務商提供維保工作,則按照約定協議規定的責任方承擔運維工作,但在責任方運維過程中,數據中心人員應該發揮陪同監督的作用(保證協議約定以外的設備在責任方運維操作過程中不受影響,做到數據中心的設備必須專人負責使用)以及適當的技術支持。
隨著數據中心規模的擴大,其相應配套的基礎設施數量也在激增,幾乎每天都會有設備出現故障,為了不影響數據中心業務的正常運行,運維中心應該備有充足的備件,及時對故障部件進行更換,以保證應急事件發生時有序高效地執行。另外,庫房備件也應該做到專人負責,對備件清單及物理位置進行更新,對不足的備件及早進行采購。
二、機房環境衛生管理
為了保證設備運行在最佳工況下,讓設備的生命周期得以延長,從而降低數據中心的運行開支,一個干凈整潔的機房環境是十分必要的。怎樣給機房設備提供一個無塵清新的運行環境呢,需要保證一下兩點:
1、在機房剛交付時,讓保潔對機房環境衛生進行大掃除(除了地面清潔、機柜以及冷通道的清潔外,還需要清除架空地板下施工遺留的電纜碎屑、螺絲等);在機房交付后,由于機房運維人員日常巡檢或者故障排查等原因,機房環境目前做不到絕對的無塵,這就要求機房運維人員需要穿著專用工作服和專用鞋,臨時進入機房人員更換專用拖鞋或使用鞋套方可進入機房內。同時,需要保潔對機房內部衛生進行定期清理(小編所在的數據中心,頻次在一個月一次);在機房保潔過程中,尤其在夏季,也需要關注門、窗的密封性,以防窗戶和門縫產生冷凝水,一旦發現問題及時解決;最后,每年年末對機房環境衛生進行評估,找出隱患并制定整改措施。
2、機房內包括值班室禁止帶入食品,以免引入鼠患,所以需要在機房區域以及動力區域放置捕鼠器、門口放置擋鼠板(小編所在數據中心,曾經發生過鼠患,因老鼠咬破電纜而發生短路),一旦發現鼠患或者其他動物進入,應立即采取措施,避免給數據中心造成不必要的損失。另外,機房內嚴禁吸煙、喝水、吃食物等,一經發現需立刻制止,并制定相應的處罰措施。當然,機房內包括機房走道嚴禁堆放易燃易爆品,如設備進場遺留下的紙箱或者廢紙等。
三、機房設備性能優化管理
數據中心已成為用電量增長最快的行業,龐大的數據中心數量和規模,已經讓電力行業不堪重負,數據中心理應走在節能的前列,提升數據中心運營能效。基礎設施部門績效考核的一個關鍵指標是PUE,PUE=(IT負載能耗+動力設備能耗)/ IT負載能耗,目前新建的數據中心PUE普遍在1.75左右,IT負載能耗是由業務需求量決定的,如何最大化降低PUE值,在于基礎設施部門如何讓空調制冷量最大限度地冷卻IT設備。
1、目前機房普遍采用的是架空地板下送風、上回風形式,這種粗放式冷卻方式,冷卻效率較低。為了減少這種能源浪費,目前主流采用的是冷熱通道隔離形式,避免冷熱氣流混合。在機房資源分配時,機房需求部門應嚴格按要求擺放IT設備,避免出現設備出風口和進風口顛倒的情況,另外,機房內電源、光纖和網絡布線應遵循橫平豎直的原則,減少氣流組織損耗。
2、新進設備在機柜上不恰當擺置,同樣會引起局部熱點和溫度倒掛現象。為避免出現此類問題,設備的擺置應遵循先下后上的方式,設備間間隔1U的距離均勻放置,直至擺滿整個機柜。在未安裝設備的位置應放置盲板,以及機柜中電源布線、網絡布線應用毛刷封閉,減少氣流損失。
四、機房設備報廢
? ? ? ?數據中心本身是一個資源消耗型的單位,在運營過程往往采用節流的方式減少其開支,其配置的硬件資源往往都是十分昂貴的,因此,有必要制定一套完善報廢流程。設備管理部一般規定滿足如下條件時,方可申請設備報廢:
? 1)設備因損壞而無法維修;
? 2)設備維修成本超過新購同類設備報價的70%以上(含70%);
? 3)設備資產折舊已完成并達到使用年限。
注:以上機房硬件設備管理制度僅根據小編任職的數據中心進行總結,有如不同觀點歡迎留言交流。
資料免費送(點擊鏈接下載)
史上最全,數據中心機房標準及規范匯總(下載)數據中心運維管理 | 資料匯總(2017.7.2版本)? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
加入運維管理VIP群(點擊鏈接查看)
《數據中心運維管理》VIP技術交流群會員招募說明
加入學習群掃描以下二維碼或者添加微信:
wang2017bj
總結
以上是生活随笔為你收集整理的数据中心的运维管理原则(二)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 爆料!亦庄地区数据中心将面临史上最长群体
- 下一篇: “数据中心运维管理VIP学习群”问题汇总