EMC存储产品分析介绍 (一)
在存儲界,EMC是一艘巨型航母,其具有非常完整的產(chǎn)品線,從最普通的磁盤陣列開始到非常高端大氣的SSD存儲陣列,從支持小企業(yè)應(yīng)用的小規(guī)模存儲產(chǎn)品,到支持海量存儲的云系統(tǒng),從普通的備份軟件到支持海量數(shù)據(jù)去重的備份系統(tǒng)。EMC都一一提供了解決方案,可以說EMC在存儲界打造了一艘無與倫比的航空母艦。
面對EMC龐雜的存儲系統(tǒng),很多人都會無從選擇。下面通過對EMC產(chǎn)品的特性,以及產(chǎn)品技術(shù)進(jìn)行梳理,從而更好的理解EMC在存儲界的布局。
高端存儲陣列VMAX
VMAX產(chǎn)品就是我們很熟悉的在教科書上經(jīng)常出現(xiàn)的Symatrix系統(tǒng)。該產(chǎn)品是一款高端的磁盤陣列系統(tǒng),其采用星型網(wǎng)絡(luò)互聯(lián)的NUMA架構(gòu),VMAX的互聯(lián)示意圖如下所示:
通過上圖可以看出,VMAX最多可以連接8組head,每組head都是一對active-active雙控對,也就是說整個系統(tǒng)最多可以互聯(lián)16個head。這16個head通過rapidIO進(jìn)行兩兩互聯(lián),從而形成非常復(fù)雜的互聯(lián)網(wǎng)絡(luò),這個互聯(lián)網(wǎng)絡(luò)被稱之為virtual?matrix。從整個系統(tǒng)來看,VMAX是一套CC-NUMA系統(tǒng),一個機(jī)頭可以訪問系統(tǒng)中的所有內(nèi)存,位于Head本地的內(nèi)存被稱之為local內(nèi)存,其余的為remote內(nèi)存。在軟件上,為了提高系統(tǒng)性能,在VMAX中加入了SSD作為cache,并且有一套Fast?Automatically?Storage?Tier軟件實(shí)現(xiàn)存儲自動分層。
在市場上,和這套系統(tǒng)類似的系統(tǒng)有HP的3PAR陣列,該陣列的結(jié)構(gòu)和VMAX幾乎一致,但是在硬件上做了很多特殊的定制,另外,3PAR沒有采用RapidIO作為互連總線,其采用了PCI-E作為節(jié)點(diǎn)之間的互聯(lián),該產(chǎn)品的互連網(wǎng)絡(luò)如下所示:
值得一提的是3PAR實(shí)現(xiàn)了virtual?RAID,該RAID沒有采用傳統(tǒng)RAID的方式,而是建立在Chunk的基礎(chǔ)之上。
除此之外,在高端陣列的市場領(lǐng)域,還存在著其他產(chǎn)品架構(gòu),例如IBM的XIV具有更好的可擴(kuò)展性。上面提到對于VMAX之類的架構(gòu),最大的問題在于可擴(kuò)展性有限,因此,IBM的高端陣列提出了MPP的架構(gòu)模式,IBM的XIV架構(gòu)如下所示:
在該架構(gòu)中,interface?module和data?module是分離的,他們通過以太網(wǎng)絡(luò)或者Infiniband互連起來。這種架構(gòu)的最大優(yōu)點(diǎn)在于具有更高的可擴(kuò)展性,但是,軟件設(shè)計(jì)的復(fù)雜度要高于VMAX這種NUMA架構(gòu)。
總體來講,VMAX之類的高端陣列滿足對IOPS、Throughput有較高要求的應(yīng)用,對于一般要求的應(yīng)用,可以選用EMC的中低端存儲產(chǎn)品VNX。
中低端存儲產(chǎn)品VNX
VNX產(chǎn)品包括原有的Celerra和Clariion系統(tǒng)。Celerra是NAS/ISCSI機(jī)頭,而Clariion則是提供后短存儲的盤陣。目前,對于VNX產(chǎn)品系列提供了低端的VNXe和中端的VNX系列。下圖是VNX盤陣的結(jié)構(gòu)圖:
從這個結(jié)構(gòu)圖可以看出VNX的后端是一種典型的雙控盤陣。當(dāng)然,VNX的軟件有很多的附加值,例如其支持offline的重復(fù)數(shù)據(jù)刪除,并且支持volume卷的thin?provisioning,另外還支持塊級快照等功能。在導(dǎo)出協(xié)議上,其支持NFS、CIFS、MPFS、PNFS、FC、ISCSI以及FCoE等協(xié)議。市面上的中低端存儲,基本都是采用的這種雙控模式,提高了系統(tǒng)的單機(jī)可靠性。IBM、HP、DELL、NetApp和HDS都有相應(yīng)的產(chǎn)品。
去重備份存儲DataDomain
DataDomain是一種后端去重設(shè)備。其可以支持多臺備份服務(wù)器提供在線數(shù)據(jù)去重。
在線塊級數(shù)據(jù)去重的最大問題是性能問題。數(shù)據(jù)去重大家采用的原理都差不多,將數(shù)據(jù)流分成大小不等的塊,自動分塊算法各家有所不同,其基本目的是為了提高數(shù)據(jù)去重效率。常用的自動數(shù)據(jù)分段算法可以參考《重復(fù)數(shù)據(jù)刪除過程中的數(shù)據(jù)自動分段》。分段之后的數(shù)據(jù)塊會通過SHA1算法得出一個Fingerprint,然后在系統(tǒng)中查找這個Fingerprint是否存在?如果存在,那么說明輸入的數(shù)據(jù)段是一個重復(fù)數(shù)據(jù),不需要保存在存儲系統(tǒng)中。反之,輸入的數(shù)據(jù)塊會被保存到存儲系統(tǒng)中。從這個過程可以看出,數(shù)據(jù)去重最大的問題在于如何查找fingerprint?由于一個存儲系統(tǒng)數(shù)據(jù)量很大,那么這些fingerprint如何被管理、檢索是系統(tǒng)實(shí)現(xiàn)的關(guān)鍵。DataDomain系統(tǒng)的硬件是自定義的Numa架構(gòu)系統(tǒng),Numa的意義在于可以支持很大的內(nèi)存空間,如果將幾乎所有的fingerprint都維護(hù)在內(nèi)存中,那么Fingerprint檢索問題就變成了內(nèi)存操作問題。除了在硬件上自定義之外,DataDomain為了提高數(shù)據(jù)去重效率,在軟件上也頗下了一番功夫。提出了SISL磁盤數(shù)據(jù)分布方式,以及采用Victor等Fingerprint?Cache優(yōu)化方式。其中最有意思的還是SISL磁盤數(shù)據(jù)分布方式,SISL充分考慮了備份數(shù)據(jù)流的數(shù)據(jù)相關(guān)性,因此在存儲的時候相同stream的數(shù)據(jù)會連續(xù)分布在臨近磁盤空間。這樣可以最大限度提高磁盤性能。
DataDomain的最為后端備份產(chǎn)品,另一個很重要的特征是高數(shù)據(jù)可靠性,即使在多塊盤壞的狀況下,即使RAID已經(jīng)失效,數(shù)據(jù)還是可以盡最大努力得以恢復(fù),從而很好的保證了作為備份系統(tǒng)的數(shù)據(jù)高可用性。
?
總結(jié)
以上是生活随笔為你收集整理的EMC存储产品分析介绍 (一)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Android Fragment应用实战
- 下一篇: 委托到Lambda的进化: ()= {