日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

编程加速服务器_FPGA加速驱动新时代的数据洪流,下篇

發布時間:2024/7/23 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 编程加速服务器_FPGA加速驱动新时代的数据洪流,下篇 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

目 錄

  • 人工智能計算加速器產品系列的相關布局
  • FPGA開發的痛點與潛在方案
  • 結語
  • 在《FPGA加速驅動新時代的數據洪流,上篇》中,老石介紹了英特爾應對大數據時代的整體戰略布局,特別是基于FPGA的各類智能網卡和網絡解決方案。在本篇中,老石會繼續介紹英特爾FPGA在人工智能和其他熱點領域的布局和大動作,以及總結梳理一些FPGA開發會遇到的痛點和潛在的解決方案。

    1

    人工智能計算加速器產品系列的相關布局

    在本次數據中心創新峰會上,英特爾宣布了Xeon處理器的詳細路線圖,即基于英特爾14nm工藝的Cascade Lake(2018年底出貨),基于14nm工藝的Cooper Lake(2019年出貨),以及基于10nm工藝的Ice Lake(2020年出貨)。

    這三款Xeon處理器都在內部集成了對深度學習加速器的原生支持,從而更好的針對人工智能應用進行計算和加速。除此之外,英特爾還展示了“泛數據中心”業務群中針對人工智能應用的全棧芯片產品組合。

    在人工智能的計算和加速領域,FPGA也被廣泛用作硬件加速模塊來使用,并被部署于數據中心本身以及很多邊緣計算的場合。

    對于FPGA在數據中心領域的應用,最有名的例子就是微軟在其數據中心對FPGA使用進行的一系列針對人工智能計算的開創性的探索。

    例如,微軟在它最新公布的“腦波項目(Project Brainwave)”中,使用了英特爾FPGA,構建了實時深度學習平臺。它利用了FPGA的低延時、高并行、低功耗的特點,實現了對Bing搜索服務、微軟Azure云平臺等多項業務的跨越式加速。關于微軟的FPGA項目已有很多文章進行介紹,本文不再展開。

    另外,英特爾于2017年發布了用于Xeon服務器的新一代標準化的“可編程加速卡(Programmable Acceleration Cards – PACs)”,以及配套的加速棧開發軟件和用戶接口,如下圖所示,并已經得到了包括戴爾、富士通、浪潮等服務器大廠的采用和配套支持。這款加速卡可以使用戶在多個領域進行定制計算加速,包括人工智能、大數據、高性能計算等。

    FPGA的應用也逐步擴展到網絡邊緣和端點,例如智能安防、視頻采集和處理、自動駕駛和機器人等等,直接在數據來源進行計算加速,并進行人工智能模型的推斷和處理,見下圖。

    邊緣計算+人工智能通常是國內外初創企業切入市場的主要領域。這一方面是由于數據中心市場太過龐大,因此被巨頭牢牢把持難以進入,另一方面也是由于在這個領域更容易通過創新的算法和方案獲得一席之地。

    我國的兩個主要代表企業就是地平線和深鑒科技。其中,前者已獲得英特爾領投的A+輪近一億美元投資,并通過此次投資將FPGA 事業部負責人Dan McNamara安排加入了地平線的董事會;而后者已在A+輪融資后被另一個FPGA大廠Xilinx全資收購。由此,可以十分清晰的看到FPGA公司對邊緣計算和人工智能領域的積極布局。

    2

    FPGA開發的痛點與潛在方案

    至此可以看到,英特爾已經在泛數據中心領域開展了全面的布局和規劃。其中,FPGA在驅動大數據傳輸和計算這兩個關鍵領域均扮演著重要角色,并且覆蓋了從云端到網絡邊緣的各個部分。

    然而,盡管FPGA被某些國內媒體熱捧為“萬能芯片”,真正的實現對FPGA的廣泛使用還是存在很多難點亟待克服。

    第一,學界和業界仍然沒有開創性的方法簡化FPGA的開發,這可以說是現階段制約FPGA廣泛使用的最大障礙。

    與CPU或GPU成熟的編程模型和豐富的工具鏈相比,高性能的FPGA設計仍然大部分依靠硬件工程師編寫RTL模型實現。RTL語言的抽象度很低,往往是對硬件電路進行直接描述,這樣一方面需要工程師擁有很高的硬件專業知識,另一方面在開發復雜的算法時會有更久的迭代周期。因此,FPGA標榜的可編程能力與其復雜的編程模型之間,形成了鮮明的矛盾。

    近五到十年來,高層次綜合(High Level Synthesis - HLS)一直是FPGA學術界研究的熱點,其重點就是希望設計更加高層次的編程模型和工具,利用現有的編程語言比如C、C++等,對FPGA進行設計開發。在這期間有趣的成果層出不窮,其中有代表性的HLS初創公司有多倫多大學Jason Anderson教授及其學生創辦的LegUp Computing,以及UCLA叢京生教授創辦的Falcon Computing等(見下圖)。

    在工業界,兩大FPGA公司都選擇支持基于OpenCL的FPGA高層次開發,并分別發布了自己的API和SDK等開發工具。這在一定程度上降低了FPGA的開發難度,使得C語言程序員可以嘗試在FPGA平臺上進行算法開發,特別是針對人工智能的相關應用。

    盡管如此,程序員仍然需要懂得基本的FPGA體系結構和設計約束,這樣才能寫出更加高效的OpenCL模型。另外,基于OpenCL的FPGA設計移植性不是很好,且嚴重基于廠商提供的開發工具和底層模塊的性能,調試起來也不甚便利。

    在數據中心網絡應用領域,兩大FPGA公司也開始支持名為P4的網絡編程語言。P4語言大約于2014年由斯坦福大學的Nick McKeown教授提出,主要用來描述網絡交換、路由選擇和數據包處理規則,非常適合數據中心里高速網絡通信的應用場景。關于P4的具體內容在本文中不再展開,其內容值得再寫一篇文章詳細探討。其實相比全通用的HLS設計而言,類似于P4的針對某類特定應用的HLS工具或許有更大和更快的發展前景。

    類似的還有英特爾最新發布的OpenVINO(Open Visual Inference & Neural Network Optimization - 開放的視覺推理和神經網絡優化)開發套件。

    顧名思義,OpenVINO專為計算機視覺和深度學習在邊緣計算的應用場景進行優化,其最大特點是支持英特爾的全棧視覺加速方案,包括CPU、GPU、FPGA以及Movidius VPU等,并支持多種深度學習框架。其中,在FPGA上使用OpenVINO進行開發,可以取得高達19倍的性能提升,如下圖所示。

    第二,FPGA并非適用于各種應用場景。特別是對于一些邊緣計算和嵌入式應用,它們對價格、功耗、性能以及可靠性的統籌要求很高,其中往往價格會是主要的考慮因素。這樣基于FPGA的方案相比于GPU、SoC或者ASIC的方案并沒有很大的優勢,這是由于FPGA并非針對某一特殊應用場景而設計優化。

    為了解決這個問題,英特爾近日收購了“結構化ASIC”設計公司eASIC,并計劃將其整合到公司的FPGA事業部中。結構化ASIC設計可以看成是FPGA與ASIC的折中,見下圖。

    結構化ASIC的主要特點有以下兩點:

  • 通過犧牲FPGA的一部分可編程性,換取低功耗、低成本和高性能;
  • 通過犧牲ASIC對設計和布局的深入優化,換取更快的設計流片時間。
  • 由此可見,對于很多對成本和功耗敏感的應用場景,這種結構化ASIC的設計方法有著很強的競爭力。

    有需要購買Xilinx altera TI ADI品牌器件的朋友,請聯系VX293580331 原裝正品 終身質保 價格最低!歡迎咨詢與推薦!

    3

    結語

    本文總結了在英特爾“以數據為中心(Data-Centric)”的創新峰會上發布的和FPGA相關的主要技術內容,并由此延伸探討了FPGA在人工智能和大數據時代的機遇和挑戰。

    可以說,如今FPGA在泛數據中心應用領域再次煥發新生,各種全新機遇接踵而至。同時我們看到,機遇往往伴隨著挑戰,只有勇于應對挑戰,才能在新的時代不斷前進。

    創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎

    總結

    以上是生活随笔為你收集整理的编程加速服务器_FPGA加速驱动新时代的数据洪流,下篇的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。