日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

华为 达芬奇芯片 架构_寒武纪的AI架构(华为技术有限公司)

發布時間:2023/12/19 综合教程 112 生活家
生活随笔 收集整理的這篇文章主要介紹了 华为 达芬奇芯片 架构_寒武纪的AI架构(华为技术有限公司) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

達芬奇架構是基于AI計算功能設計的,并基于高性能3D Cube計算引擎,極大地提高了計算能力和功耗比。
根據達芬奇架構,進行了以下優化:

多核堆棧用于并行計算能力擴展
通過設計片上存儲器 on-chip memory(高速緩存/緩沖區Cache/Buffer)以縮短Cube操作和存儲距離,減少了對DDR的訪問,并減輕了馮·諾依曼的瓶頸問題。
在計算和外部存儲之間設計了高帶寬片外存儲器(HBM),以克服計算資源共享存儲器的訪問速度限制。
為了支持大規模的云側神經網絡訓練,設計了超高頻段網狀網絡(LSU),以互連多個多維數據集擴展芯片。
總而言之,達芬奇體系結構具有以下三個features:
**

1. Unified Architecture

支持從tens of milliwatts to hundreds of watts 的全場景AI系列芯片。

2. Scalable Computing

  1. 每個AI內核可以在一個時鐘周期內完成4096個MAC操作。
  2. 靈活的多核堆棧,可擴展的多維數據集:16 x 16 x N,N = 16/8/4/2/1
  3. 在訓練和推理方案中支持多種混合精度(int8 / int32 / FP16 / FP32)和數據精度要求。
  4. 集成張量,矢量和標量計算單位。

3. 可擴展的片上互連Scalable Memory
用于特定和分布式,顯式控制的內存分配設計

4 TByte / s L2緩沖區

1.2 TB / s HBM高帶寬內存

4. 可擴展的片上互連******On-chip Interconnection

超高帶寬片上網狀網絡[Ultra-high bandwidth on-chip mesh network (LSU)]

基于達芬奇的創新架構,華為首次發布了7 nm Ascend 910(Ascend-Max)和12 nm Ascend-Mini(Ascend 310)。 Ascend 910是世界上最大的單芯片計算密度。 支持在云端進行分布式大規模培訓。 如果集成了1024個Ascend 910,則將創建全球最大的AI計算集群,提供256P的性能。 無論模型多么復雜,都可以輕松地對其進行訓練。

基于達芬奇架構,華為還計劃了適用于藍牙耳機,智能手機和可穿戴設備的Ascend Ascend芯片系列(Nano,Tiny和Lite)。 將來,Ascend Ascend芯片系列將以IP模式與其他芯片集成在一起,以服務各種智能產品。

此外,達芬奇AI芯片架構還考慮了軟件定義的AI芯片的功能。 CANN是用于芯片的高度自動化的操作員開發工具。 它是為神經網絡定制的計算架構。 CANN將開發效率提高了三倍。 除效率外,還考慮了操作員績效以適應AI應用程序的快速發展。

transfer from:
https://forum.huawei.com/enterprise/en/huawei-da-vinci-ai-chip-architecture/thread/616780-895

總結

以上是生活随笔為你收集整理的华为 达芬奇芯片 架构_寒武纪的AI架构(华为技术有限公司)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。