CUDA支持Arm,谁将是最大的赢家?
目前,X86、Power 作為超算 CPU 計算節點的主要架構,那么 Nvidia 宣布 CUDA 支持 Arm 誰將是最大的贏家?
文:包永剛
原標題:CUDA 支持 Arm 是實現百萬兆級超算的新途徑,還是 Nvidia 和 Arm 的好機會?
超級計算機(Supercomputer)通常簡稱超算,在科學界常被視作一個國家技術領軍能力的指標,因為它能夠為 AI、空氣動力、大氣科學、能源科學等重要技術的研究提供算力支撐。如今強國之間的競爭已經進入到了百萬兆級超算的時代,這就需要更強大的處理器。目前,X86、Power 作為超算 CPU 計算節點的主要架構,那么 Nvidia 宣布 CUDA 支持 Arm 誰將是最大的贏家?
超算競爭進入百萬兆級時代
去年六月,美國能源部公布了世界上最快的超級計算機——Summit,反超中國超算太湖之光重奪超算 Top 500 第一的位置,并且美國表示他們預計在 2021 年建造一臺每秒運算數十億億次計算機“極光(Aurora)”,甚至會打造更高效能的計算機。
2019 超算 Top 500
當然,中國也在建立一個百萬兆級超級計算機系統,有消息稱它基于已構建的三種原型系統:曙光、天河和神威。日本和歐洲也不甘落后,日本希望在 2021 年有一臺百萬兆級的超級計算機,歐洲人則在希望在 2023 年實現這一目標。顯然,超級計算機的競賽跨入了 Exascale 計算(百萬兆級的計算,也可稱E級超算)時代。
用一個不精確的說法來解釋百萬兆級計算,一個百萬兆級計算機一瞬間進行的計算,相當于地球上的所有人每天每秒都不停地計算四年。這樣強大的計算能力需要更加復雜的系統。與普通計算機一樣,超算同樣由硬件和軟件系統組成,但超算僅硬件部分就由高速運算系統、高速互連通信網絡系統、存儲系統、維護監控系統、電源系統、冷卻系統和結構組裝設計等部分組成。
其中,高速運算系統負責邏輯復雜的調度和串行任務和并行度高的任務,可采用同構計算(純 CPU 組成計算節點),也可以采用異構計算(CPU+ 加速器組成計算節點)的方式。
實現百萬兆級超算的新途徑
根據國際組織 TOP500 編制的超級計算機榜單,從 2019 年度 ISC 國際超算大會上公布的超算性能 500 強榜單中,我們不難發現 IBM Power、Nvidia Volta/Tesla、Intel Xeon 顯然是超算計算節點的重要組成。
2019 年度 ISC 國際超算大會上公布的超算 Green500
但是,隨著算力的進一步增強,超算產生的熱量不僅會造成更多的資源消耗,冷卻系統的設計同樣面臨更大的挑戰,因此沒瓦特性能也十分重要。TOP500 也編制了一個 Green500 的超算排行榜,這個排行榜比拼的不是性能,而是比拼每瓦性能,所以,即便某個超算在 TOP500 榜單中墊底,在 Green500 中卻獲得好名次。
根據最新的 Green500 排行榜,在全球最節能的 25 款超級計算機中,有 22 款都得益于 Nvidia 的支持。
這其中的關鍵之一就是采用了異構計算的方式,讓 x86 或者 Power 架構的 CPU 與 Nvidia GPU 協同,把繁重的處理作業卸載至更為節能的并行處理 CUDA GPU 之上。不過在 CPU 市場,Arm 架構也不可忽略,那么在超算的百萬兆級競爭中,Arm CPU 是否也能發揮優勢?
現在下結論還為時尚早,但英偉達并不打算錯過這個可能的機會。6 月 17 日,2019 年度 ISC 國際超算大會上,Nvidia 宣布將于年底前向 Arm 生態系統提供全堆棧的 AI 和 HPC 軟件,該堆棧為 600 多個 HPC 應用程序和所有 AI 框架提供加速,其中包括了所有 Nvidia CUDA-X AI 和 HPC 庫、GPU 加速的 AI 框架和軟件開發工具,如支持 OpenACC 的 PGI 編譯器和性能分析器。
這也就意味著,在 Nvidia 的堆棧優化完成之后,Nvidia 將為所有主要 CPU 架構提供加速,包括 x86、Power 和 Arm。
對于新的宣布,Nvidia 創始人兼首席執行官黃仁勛表示:“超級計算機是促進科學發現的重要工具,建立百萬兆級超級計算將能夠極大地擴展人類知識的邊界。隨著傳統計算規模擴展步伐的停止,功率也將成為所有超級計算機的限制因素。Nvidia CUDA 加速的計算和 Arm 的高能效 CPU 架構的相結合,將助力 HPC 社區實現大幅提升,以達到百萬兆級。”
Nvidia 的好生意
從百萬兆級超算建造者的角度看,Arm CPU+Nvidia GPU 是一個新選擇,但從 Nvidia 的角度看,CUDA 支持 Arm 不是一個簡單的宣布,而是資源的投入。讓 Nvidia 有動力進行這樣的投入,是各國和巨頭公司們的需求和投入。
僅美國方面,下一代超算技術的研發總投入將達到 4.3 億多美元,美國能源部部長里克⋅佩里就表示,這些資金劍指“下階段研發百億億次系統的全球競賽”。顯然,百萬兆級超算的構建少不了 Nvidia 的 GPU,特別是 AI 技術蓬勃發展并且越來越重要的當下。此時 Nvidia 又聯合 Arm 為構建百萬兆級超算提供了新的途徑,自然能讓其從超算市場獲得更多的營收。
Nvidia 的在超算市場的努力不止 CUDA 支持 Arm,Nvidia 在 2019 年度 ISC 國際超算大會上還宣布了全球速度排名第 22 位的超級計算機——DGX SuperPOD。根據 Nvidia 的說法,該超級計算機系統采用了 96 臺 NvidiaDGX-2H 超級計算機,內含 1536 顆 Nvidia V100 Tensor Core GPU,由 Nvidia NVSwitch 及 Mellanox 網絡結構相聯接。其處理能力高達 9.4 petaflops,能夠用于訓練安全自動駕駛汽車所需要的海量深度神經網絡。
對比來看,具備同等性能的其他 TOP500 超級計算機系統需要由數千臺服務器構建,而 DGX SuperPOD 占地面積更少,體積比同等系統小 400 倍左右。部署方面,其他同等規模的系統通常需要6-9 個月才能完成部署畢,DGX SuperPOD 在工程師采用經過驗證的規范性方法情況下,僅需 3 個星期。
據雷鋒網了解,Nvidia DGX 系統已經服務于眾多對大規模計算有需求的企業機構,例如寶馬、Continental、福特與 Zenuity 等汽車公司,還有 Facebook、微軟與富士膠片等公司,還有研究領域的日本理化學研究所與美國能源部實驗室等。
Nvidia 希望還沒有部署人工智能的數據中心的企業機構使用 Nvidia SuperPOD 架構。這可以讓雙方都從中獲益,不止于此,Nvidia 還能通過構建這樣的超級計算機,可以學會如何設計面向大規模人工智能機器的系統。
顯然,超算特別是百萬兆超算對 Nvidia 是可以多贏的好生意。
Arm 的好機會
對于 Arm 而言,百萬兆級超算市場則是一個好機會。在移動市場占據領導地位的 Arm 遇到市場增長放緩時,同樣也希望能夠將其架構拓展到新的市場帶來增長,近年來也在努力聯合合作伙伴推動 Arm 服務器的發展,不過情況并不理想。
但在超算市場,特別是 CUDA 支持 Arm 之后,Arm 能夠迎來了好機會。Atos 高級執行副總裁、大數據和網絡安全部門負責人 Pierre Barnabé表示:“憑借萬寶龍項目,以及為百萬兆級超級計算機 BullSequana X 所做的 Arm 計算刀片設計,Atos 成為了 ARM 生態系統中的先驅者。”
全球重要的超算提供商 Cray 總裁兼首席執行官 Peter Ungaro 表示:“我們的 Cray 系統管理和編程環境(編譯器、庫和工具)已經能夠在 XC 和未來的 Shasta 超級計算機上支持 Arm 處理器,將 CUDA 和 CUDA-X HPC 和 AI 軟件堆棧用于 Arm 平臺,并將其與 Cray 系統管理和編程環境緊密集成,能夠助力我們的超級計算機實現我們的愿景。”
另外,Ampere Computing、CSC、EPI、HPE、Jülich 超算中心、Marvell 等都表達了對于 CUDA 支持 Arm 的期待。同時還要看到,CUDA 支持 Arm 能夠建造百萬兆級超算,同樣也能讓服務器廠商更便捷地制造 Arm 服務器,所以,Arm 的好機會是讓其能夠更好的拓展架構優勢。
雷鋒網小結
百萬兆級超算系統是各國努力正在打造的新一代超算,此時,英偉達 CUDA 支持 Arm 給正在打造新一代超算的國家以及對算力有更高需求的企業一個新的選擇,這既是英偉達能夠多贏的好生意,更是 Arm 進入超算市場的好機會。現在有眾多的支持者表態支持這一新路徑,我們雖然對此也保持積極的態度,但結果仍需通過實際的百萬兆級的超算系統來得出。創新不會百分之百成功,但創新才是推動革新的最大動力。
總結
以上是生活随笔為你收集整理的CUDA支持Arm,谁将是最大的赢家?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 格兰仕再发声明:会坚持与不公平抗争 反对
- 下一篇: 清华排名超过耶鲁、哥大!最新QS世界大学