IBM NorthPole 芯片测试:比常用的 12nm GPU 和 14nm CPU 能效高 25 倍
11 月 12 日消息,IBM 的 NorthPole 架構芯片已經(jīng)開發(fā)了近十年,現(xiàn)在已經(jīng)越來越完善、越來越強大。
官方現(xiàn)在通過《科學》雜志發(fā)表了一組 NorthPole 的基準測試結果,堪稱是一個新的里程碑。
根據(jù)對 ResNet-50 模型的測試,基于 TrueNorth 架構的 12 納米芯片比常用的 12 納米 GPU 和 14 納米 CPU 能效比高 25 倍。
據(jù) IBM 稱,NorthPole 在延遲和計算所需的空間方面也表現(xiàn)更好,超過了所有主流架構,包括基于 4 納米工藝的 GPU。
那么,它是如何實現(xiàn)這一成果的呢?因為它 256 個核心本身就集成了一塊內存芯片而無需單獨連接,NorthPole 用于 220 億個晶體管,其每個核心都可以執(zhí)行 2048 個運算。
該公司稱,其架構消除了馮?諾依曼瓶頸,該瓶頸圍繞著大多數(shù)系統(tǒng)中 CPU 和 RAM 之間數(shù)據(jù)傳輸引起的延遲。因此,它可以比市場上最好的 GPU(包括 Nvidia 最強 AI 顯卡)運行得更快。
IBM 研究部門的 Dharmendra Modha 表示:“從架構上看,NorthPole 模糊了計算和內存之間的界限。在單個核心層面上,NorthPole 表現(xiàn)為接近內存的計算;而在芯片外部的輸入輸出層面上,它表現(xiàn)為主動內存。”
注意到,AMD 也探索了類似的技術,并成功將內存和計算結構集成到單個組件中。上個月,Xilinx 便展示了其 Virtex XCVU7P 卡,其中包括八個內存加速器模塊。
據(jù)介紹,IBM 在其 NorthPole 芯片中為每個計算核心的添加了內存芯片,他們認為這個組件非常適合新興的 AI 用例,包括與計算機視覺相關的用途。此外,它還經(jīng)過了自然語言處理和語音識別方面的測試。NorthPole 還適用于邊緣應用,這些應用可實時處理大量數(shù)據(jù)。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,所有文章均包含本聲明。
總結
以上是生活随笔為你收集整理的IBM NorthPole 芯片测试:比常用的 12nm GPU 和 14nm CPU 能效高 25 倍的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 手机电池上正负极怎么区分
- 下一篇: 联想双 11 战报:全网销售额破 70