日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 人文社科 > 生活经验 >内容正文

生活经验

NNVM Compiler,AI框架的开放式编译器

發(fā)布時(shí)間:2023/11/28 生活经验 48 豆豆
生活随笔 收集整理的這篇文章主要介紹了 NNVM Compiler,AI框架的开放式编译器 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

NNVM Compiler,AI框架的開放式編譯器
深度學(xué)習(xí)已變得無處不在且不可或缺。在多種平臺(tái)(例如手機(jī),GPU,IoT設(shè)備和專用加速器)上部署深度學(xué)習(xí)工作負(fù)載的需求不斷增長(zhǎng)。宣布了TVM堆棧,以彌合深度學(xué)習(xí)框架與面向性能或效率的硬件后端之間的鴻溝。TVM堆棧使為深度學(xué)習(xí)框架輕松構(gòu)建端到端編譯變得容易。擁有適用于所有框架的統(tǒng)一解決方案甚至?xí)谩?br /> 威斯康星大學(xué)艾倫分校和AWS AI團(tuán)隊(duì)以及其他貢獻(xiàn)者,宣布NNVM編譯器的發(fā)布,NNVM編譯器是一種開放式深度學(xué)習(xí)編譯器,用于將前端框架工作負(fù)載直接編譯到硬件后端。使用TVM堆棧中的兩級(jí)中間表示(IR)來構(gòu)建它。歡迎讀者參考原始的TVM公告,以獲取有關(guān)TVM堆棧的更多技術(shù)細(xì)節(jié)。借助TVM堆棧,NNVM編譯器可以:
? 在高級(jí)圖IR中表示并優(yōu)化常見的深度學(xué)習(xí)工作負(fù)載
? 轉(zhuǎn)換計(jì)算圖以最大程度地減少內(nèi)存利用率,優(yōu)化數(shù)據(jù)布局并融合不同硬件后端的計(jì)算模式。
? 提出從前端深度學(xué)習(xí)框架到裸機(jī)硬件的端到端編譯管道。

NNVM編譯器可以直接從深度學(xué)習(xí)框架(例如Apache MXNet)中獲取模型。支持模型交換格式,例如ONNX和CoreML。ONNX支持使NNVM能夠從PyTorch,Caffe2和CNTK編譯深度學(xué)習(xí)模型。CoreML前端支持將CoreML模型部署到非iOS設(shè)備。

優(yōu)化與部署分離

NNVM編譯器應(yīng)用圖級(jí)和張量級(jí)優(yōu)化,共同優(yōu)化以獲得最佳性能。采用與現(xiàn)有深度學(xué)習(xí)框架不同的方法,后者將圖形優(yōu)化與部署運(yùn)行時(shí)打包在一起。NNVM編譯器采用了編譯器的傳統(tǒng)知識(shí),將優(yōu)化與實(shí)際部署運(yùn)行時(shí)分開。這種方法提供了實(shí)質(zhì)性的優(yōu)化,但仍保持運(yùn)行時(shí)的輕量級(jí)。編譯后的模塊僅取決于最小的TVM運(yùn)行時(shí),部署在Raspberry Pi或移動(dòng)設(shè)備上時(shí)僅需300KB左右。
Performance
NNVM編譯器仍在積極開發(fā)中,可以期待會(huì)有更多的改進(jìn),已經(jīng)開始看到可喜的結(jié)果。對(duì)性能進(jìn)行了基準(zhǔn)測(cè)試,在兩種典型的硬件配置上,與Apache MXNet進(jìn)行了比較:Raspberry PI上的ARM CPU和AWS上的Nvidia GPU。盡管這兩款芯片在架構(gòu)上存在根本差異,可以使用相同的基礎(chǔ)架構(gòu),只需要更改每種硬件的調(diào)度即可。
Nvidia GPU
GPU基準(zhǔn)和調(diào)度,將NNVM編譯器與Apache MXNet與CUDA8和cuDNN7作為Nvidia K80的后端進(jìn)行了比較。這是一個(gè)非常強(qiáng)的基準(zhǔn),因?yàn)锳pache MXNet會(huì)打開自動(dòng)調(diào)整功能以從CuDNN中選擇最佳內(nèi)核。還使用了MXNet中優(yōu)化的深度智能內(nèi)核來優(yōu)化MobileNet工作負(fù)載。

可以看出,NNVM編譯器生成的代碼勝過K80上的Apache MXNet。這些改進(jìn)歸因于聯(lián)合圖級(jí)別和內(nèi)核級(jí)別的優(yōu)化。值得注意的是,NNVM編譯器無需依賴CuDNN等外部庫,即可自行生成所有優(yōu)化的GPU內(nèi)核。
Raspberry Pi 3b
Rasberry Pi編譯堆棧,將NNVM編譯器與帶有OpenBLAS和NNPack的Apache MXNet進(jìn)行了比較。探索了使MXNet發(fā)揮最佳性能的設(shè)置:為3x3卷積打開了NNPACK中的Winograd卷積,啟用了多線程,并禁用了其他調(diào)度程序線程(因此,所有線程都被NNPack使用)。

可以看出,在ResNet18上,NNVM編譯器生成的代碼快兩倍。MobileNet上的差距,現(xiàn)有CPU DNN庫中缺乏深度卷積。NNVM編譯器利用直接生成有效的ARM代碼的優(yōu)勢(shì)。

總結(jié)

以上是生活随笔為你收集整理的NNVM Compiler,AI框架的开放式编译器的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 日韩av在线影院 | 国产美女免费无遮挡 | 中文字幕在线视频不卡 | 91视频影院 | 人妻色综合网站 | 岛国片免费在线观看 | 国产精品永久免费 | 欧美性猛交 | 自拍偷拍精品视频 | 青草青在线视频 | 亚洲国产私拍精品国模在线观看 | 男生和女生一起差差差很痛的视频 | 在线观看深夜视频 | 女18毛片 | 欧美一区二区网站 | 中文在线最新版天堂 | 午夜色综合| 99精品人妻无码专区在线视频区 | 一区二区三区xxx | 久久精品国产亚洲AV黑人 | 操欧美老女人 | chinese麻豆gay勾外卖 | 毛片网止| 午夜免费在线观看 | 成人学院中文字幕 | 久9精品 | 亚洲国产欧美自拍 | 日韩啪啪网 | 91美女诱惑 | 成人国产视频在线观看 | 日韩淫 | 日韩黄色网络 | 欧美性受xxxx黑人xyx性 | 99热在线播放 | 久久中文在线 | 久久久久久久久免费视频 | 亚洲人人插 | 亚洲天堂h | jizjiz中国少妇高潮水多 | 国产区精品在线观看 | 国产成人精 | 色婷婷av一区二区三区软件 | 亚洲a成人 | 成人福利视频导航 | 在线观看av的网址 | 一本视频 | 国产精选在线观看 | 久久久久久久偷拍 | 少妇看片 | 日韩成人激情视频 | 亚洲最大的av网站 | 欧美性大战xxxxx久久久 | a视频在线免费观看 | 精品国产乱码久久久久久闺蜜 | 日韩性生交大片免费看 | 亚洲视频在线网 | 男人深夜网站 | 在线亚洲网站 | 亚洲区自拍偷拍 | 一区视频在线免费观看 | 亚洲精品一区二区三区婷婷月 | 久久精品欧美一区二区三区麻豆 | 中文字幕123 | 在线观看成人网 | 91精品国产视频 | 国产av成人一区二区三区 | 国产3p视频| 久草五月天 | 日韩国产激情 | 国产欧洲亚洲 | 精品人妻一区二区三 | 日韩美女视频19 | 国产精品欧美日韩 | 国产精品久久综合视频 | 国产熟妇一区二区三区四区 | 一卡二卡三卡四卡在线 | 亚洲色偷偷色噜噜狠狠99网 | 国产精品无码在线 | eeuss国产一区二区三区黑人 | 亚洲一区二区三区播放 | 99精品国产99久久久久久97 | 中文字幕在线视频一区二区三区 | 成人综合站 | 色在线免费视频 | 国产动漫av | 肉色超薄丝袜脚交一区二区 | 色婷婷久久 | 中文字幕一区二区免费 | 九九热这里都是精品 | 在线视频污 | 超污视频软件 | 成人日韩视频 | 女裸全身无奶罩内裤内衣内裤 | 精品国产乱子伦一区二区 | 成年人黄色 | 日本理论中文字幕 | 日本免费一区二区三区四区 | 欧美播放 | 亚洲一区电影在线观看 |