服务器硬件层次架构
服務器硬件層次架構
MLU服務器層次結構
MLU服務器通過PCIe與主機交換數據。具有多個卡的MLU服務器層次結構系統包括五個級別:服務器級別,卡級別,芯片級別,群集級別和核心級別,如圖。
? 級別0是服務器級別,由幾個CPU控制單元,本地DDR存儲單元和幾個通過PCIe總線互連的MLU卡作為服務器級別的計算單元組成。
? 級別1是卡級別。每個MLU卡均包含本地DDR存儲單元和作為計算單元的芯片。
? 級別2是芯片級別。每個芯片由幾個群集組成,作為計算單元。
? 級別3是群集級別。每個群集由幾個加速核心作為控制和計算單元,并由共享內存作為存儲單元。
? 級別4是核心級別。每個加速核心均由本地存儲和本地處理單元陣列組成。
MLU服務器層次結構能夠通過增加卡,芯片,集群或內核的數量來方便地提高整個系統的計算能力。
MLU 270內存層次結構
下圖顯示了MLU270單通道的存儲器層次結構。每個核主要由功能單元(FU),通用寄存器組(GPR),神經元存儲單元(Neural-RAM,NRAM)和權重存儲單元(Weight-RAM,WRAM)組成。此外,四個物理核心構成一個集群。每個MLU270具有4個群集。每個內核都有一個單獨的內存,稱為Local-DRAM(LDRAM)。如圖,一個群集中的四個內核共享芯片上的共享RAM(SRAM)。此外,所有內核都可以訪問DDR上稱為Global-DRAMs(GDRAM)的全局共享內存。LDRAM,GDRAM和片上存儲通道還具有1級緩存(Last Level Cache,LLC),該緩存主要用于緩沖多個內核之間的共享只讀數據,從而加快了內存訪問速度。當BANG C程序使用指向GDRAM空間的常量指針執行內存訪問時,CNCC將優化內存訪問以啟用LLC。
MLU270內存層次結構
總結
- 上一篇: FPGA多功能应用处理器
- 下一篇: 异构计算编程