NVIDIA发布PCIe版安培计算卡:功耗骤降150W、性能20倍于上代
5月中旬,NVIDIA正式發(fā)布了全新一代“安培”(Ampere) GPU架構(gòu)、GA100 GPU核心,并宣布了首款產(chǎn)品“A100”加速計算卡,采用專有的SMX4形態(tài)。
今天,基于標(biāo)準(zhǔn)PCIe形態(tài)的A100計算卡登場了,更適合主流標(biāo)準(zhǔn)服務(wù)器。
PCIe A100仍然基于GA100核心,規(guī)模保持不變,還是臺積電7nm工藝、826平方毫米、542億個晶體管,提供6912個FP32 CUDA核心,最高加速頻率也是1.41GHz,因此峰值性能相同:單精度19.5TFlops、雙精度9.7TFlops、INT8推理1248Tops、INT8張量624Tops、FP16張量312TFlops、FP32張量156TFlops、FP32訓(xùn)練312TFlops、FP64高性能計算19.5TFlops。
NVIDIA宣稱,相比于上代Volta伏特架構(gòu)的V100計算卡,INT8推理性能、FP32訓(xùn)練性能都實現(xiàn)了20倍的提升,F(xiàn)P64高性能計算也提升了2.5倍,是歷史上進(jìn)步最大的一次。
顯存依然搭配40GB HBM2,512-bit位寬,2.4GHz頻率,1.6TB/s帶寬。
由于散熱限制,熱設(shè)計功耗從SMX4版本的400W大大降低到了250W,如此還能維持相同的峰值性能堪稱奇跡,當(dāng)然實際負(fù)載持續(xù)性能顯然無法做到滿血,但官方表示仍能有大約90%。
另外一點不同就是多卡并聯(lián),SMX4版本支持最多八塊并行,PCIe則只能兩塊并行,NVLink互連總線顯然做了精簡,但具體未披露,可能從12條砍半至6條。
NVIDIA沒有披露PCIe A100計算卡的出貨時間和價格,應(yīng)當(dāng)會很快。AMD霄龍無疑仍然還是其最佳搭檔,后者仍是唯一支持PCIe 4.0的數(shù)據(jù)中心平臺。
視頻會員活動匯總>>
愛奇藝視頻會員限時優(yōu)惠5折
優(yōu)酷視頻會員年卡5折購(99元)
騰訊視頻會員年費99元/京東plus聯(lián)合年卡128元
總結(jié)
以上是生活随笔為你收集整理的NVIDIA发布PCIe版安培计算卡:功耗骤降150W、性能20倍于上代的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 扒李沁宣传团队,老恶心了
- 下一篇: 美国人也存钱了!银行存款增加2万亿美元: