日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

5种工艺、1000+亿晶体管!Intel Xe HPC顶级计算卡秀肌肉

發布時間:2023/11/26 综合教程 40 生活家
生活随笔 收集整理的這篇文章主要介紹了 5种工艺、1000+亿晶体管!Intel Xe HPC顶级计算卡秀肌肉 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

我們知道,Intel Xe GPU架構分為四個層級,或者說四種微架構,其中以上是的Xe LP低功耗版僅供核顯、入門獨顯,即將到來的Xe HPG高性能圖形版面向中高端游戲顯卡,Xe HP高性能版適合加速計算、AI、ML等但所知最少,Xe HPC高性能計算版則是最頂級的存在,主攻大型數據中心、超算。

,這里來看看Xe HPC和首款產品Ponte Vecchio,競爭對手是NVIDIA A系列、AMD Instinct系列。

當然,它們距離普通人非常非常遙遠,但卻是技術實力的最高體現。

矢量引擎每時鐘周期可執行256個FP32、256個FP64、512個FP16等數據操作,矩陣引擎則每時鐘周期支持2048個FP32、4096個FP64、4096個BF16、8192個INT8。

與矢量引擎、矩陣引擎搭檔的,是一個更寬的寬加載/存儲單元,每個時鐘周期取回512字節數據。

,而且可以通過軟件配置作為暫存區使用,又稱共享內部顯存。

Xe核心的上一層級叫做“切片”(Slice),不同于Xe HPG上的渲染器切片(Slice),畢竟一個是做計算,一個是做圖形渲染。

,四倍于Xe HPG渲染切片的規模,同時還有8MB一級緩存、16個光追單元、一個硬件上下文(Hardware Context)單元,其中光追支持光線遍歷、邊界框相交、三角形相交,提供固定函數計算。

硬件上下文單元大家可能比較陌生,它能讓GPU同時執行多個應用,而無需昂貴的基于軟件的文本切換。

切片的上一級則是“堆棧”(Stack),至此才算一個完整的GPU。

同時,堆棧內還有大規模二級緩存、4個HBM2e內存控制器、1個媒體引擎、8個Xe鏈路,以及拷貝引擎、PCle控制器。

Xe HPC架構是可以輕松擴展的,支持多堆棧設計,屬于業內首創,依靠的是EMIB封裝和堆棧間互連通道,可保持堆棧之間的內存一致性。

比如這是雙堆棧,整體規模直接翻番,它就是后邊要說的首款Ponte Vecchio,但看架構圖,似乎不支持四堆棧。

,算力直接暴力乘以8。

Ponte Vecchio作為基于Xe HPC架構的首款產品,一切的一切都是全新的,包括驗證方法、軟件、可靠性方法、信號完整性機制、互連、供電、封裝、I/O架構、內存架構、IP架構、SoC架構。

如此復雜的芯片設計,面臨的挑戰自然是空前的,首席架構師Masooma Bhaiwala直言這是她30年來設計的最復雜的芯片,堪稱制造奇跡。

其中,Foveros 3D封裝是一個關鍵,最終的數據傳輸速度不得不提高到最初規劃的1.5倍,以便以把Foveros連接數量降至最低,但依然比之前任何設計都高了兩個數量級。

開發團隊還必須在設計初期就鎖定Foveros在所有單元上的位置,這意味著必須一開始就搞定整個平面圖布局,中途也不允許有明顯變更。

芯片設計和驗證也是全新流程,為此開發了大量新的工具、方法、腳本,并獨立安排4個主要單元,開發各自的調試軟件包,分而治之,加速開發,最終在SoC整體封裝完成幾天內就成功啟動,運行了Hello World。

再來看幾個關鍵的部分,計算單元采用臺積電N5 5nm工藝,每個集成8個Xe核心、4MB一級緩存,Foveros封裝凸點間距36微米。

,包括PCIe 5.0總線、HBM2e內存、MDFI鏈路、EMIB橋接,幾乎是在挑戰物理極限。

它采用Intel 7工藝、Foveros封裝,面積達640平方毫米,集成了多達144MB二級緩存。

,負責不同GPU之間的連接,是面向HPC、AI的縱向擴展的關鍵,每個單元有8條,實現了最高90G Serdes,可以滿足“極光”(Aurora)這樣百億億次級級超級計算機的需求。

Ponte Vecchio目前處于A0版本階段(一般到A1就投入量產),成功運行了數百個工作負載,實測FP32吞吐性能超過45TFlops,Memory Fabric緩存帶寬超過5TB/s,互連帶寬超過2TB/s。

Ponte Vecchio將有多種產品形態,最基本的單芯片做成OAM模塊,集成到一個載體基板上,AMD Instinct也有這種。

,就是一個超算節點,將用于“極光”超算。

總結

以上是生活随笔為你收集整理的5种工艺、1000+亿晶体管!Intel Xe HPC顶级计算卡秀肌肉的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。