阿里云弹性计算对视觉计算的思考与实践
簡介:利用人類已有和將有的技術加之商業手段,實現對人類感官體驗進行全方位升級。
4月21日,“2022英偉達數字孿生技術應用論壇”上,阿里云彈性計算產品專家張新濤為大家帶來了題為《阿里云彈性計算在XR業務上的應用實踐》的主題分享。
以下內容根據他的演講整理而成。
01 從云計算開始,觸摸視覺計算
2019年阿里云北京峰會上,阿里云與我們一個重要合作伙伴一同發布了一款新的圖形GPU計算實例vGN6i,演示的場景是模擬一位購車用戶通過支付寶小程序接入到一個逼真的汽車試駕3D空間,這個3D汽車和駕駛空間位于云上,購車用戶在平板電腦上完成了這次試駕體驗。這也是阿里云彈性計算業務最早接觸數字孿生客戶場景。合作過程中我們也逐步意識到數字孿生是提升全社會創造力和生產力的關鍵技術,之后我們便非常明確地加大了針對圖像和流媒體相關產品與技術的投入和積累。于是,時間到了2021年,此時“VR/AR/MR”這些概念再次流行起來,甚至變得炙手可熱,業界已經創造出了各類“Verse”來描述概念,但是在我們看來目前依然處在XR的視覺計算階段。
說明:VR/AR/MR在實現的人機接口上有較大不同,但是應用場景重疊度較高,業界統稱XR。
作為阿里云最早觸碰“XR”和"數字孿生"的產品團隊之一,我們也在內部開始與各個團隊分享針對XR產業新浪潮上的見解,上圖是2021年8月,“AR/VR/MR”以及各Verse正當火熱,我們為內部團隊解讀XR產業時的其中一頁,那時候我們的認知角度主要站在新產業熱點對全行業影響的認知上。XR作為新的信息交互方式大家都滿懷期待,但是如何通過云計算賦能到各個行業呢?產業的配合關系是怎樣的?產業體系中,對每個參與者的需求是怎么樣的?云計算在其中要貢獻什么樣的價值呢?我們不知道,但是我們更加積極的在業務實踐中去思考和摸索。我們當時提了一個概念:視覺計算計劃,8個月后的今天,我們又有了新的視角。
我們借助網上非常流行的“‘Metaverse’產業七層體系圖”說明產業體系,順便也看云計算要在其中承載的社會價值。可以看到圖中是從最接近C端用戶的體驗場景需求,一直延伸到產業的最頂端尖端基礎設施技術的需求,相比于過去每一次信息產業的變革,這次尤為復雜。從圖中我們也能體會到,XR及各類Verse是利用人類已有和將有的技術加之商業手段實現對人類感官體驗進行全方位升級,并且通過這次的升級浪潮實現全行業創造力和生產力的一次重大飛躍。
當我們把左圖中的產業需求映射到右側云計算專注提升并可以貢獻價值的領域時,我們發現這5個領域是云計算必須突破和面臨挑戰的領域,這次是產業需求對云計算的全方位挑戰。
02 阿里云超強算力迎接XR及X-Verse的產業挑戰
這5個方向的挑戰其實也是互相影響的,牽引方來自于應用交互體驗升級需求,在交互體驗實現飛躍的需求下,應用會使用到更多的人機接口方式,這直接導致計算、通信的復雜度劇增,并且還要兼容如此多的交互方式,而這些還都是技術面的挑戰。更大挑戰來自于產業生態,我們如果期待這個新交互體驗的升級發生,則需要一套與之匹配的經濟生態來驅動,這與以往的每一次IT技術革新帶來的商業生態變革一樣。
我們重點來說下牽引方:應用。早期的人機界面是紙帶和打孔機,如今我們最常用的智能手機已經可以通過2D圖像、聲音、指紋、手勢、紅外、攝像、觸屏、聲音、震動、隨身傳感器等與我們進行交互了,而更加先進的手勢識別,觸感手套也開始小規模商用了。而如今應用程序的開發,相比紙帶時期復雜了數萬倍,應用覆蓋領域擴展了數萬倍,對計算和通信需求提升了數萬倍,背后支持的經濟規模也擴大了數萬倍,開發者數量更是大幅擴增,其實后面所驅動的是一個巨大的產業生態。
因此,這次我們遇到的XR及各類Verse依然如此,這不是一次簡單使用XR設備替代其他終端的變化,這是一次產業革命。
為什么說是產業革命,因為當前的技術能力和商業模式還無法支持實現我們理想的那個數字虛擬世界。舉個例子,我們現在業界還無法使用AI CG+AI驅動+物理引擎的方式實現一個完全意義的虛擬人,其中很大限制來自于計算能力不足,帶寬和延時的挑戰依然存在,以及如何組織一個集人類信息技術大成的開發團隊來完成。
那么定義到問題層面,我們在計算性能和規模,通信帶寬和延時,生態效率與開放程度上都有一個飛躍。
計算上,需要相比當前10倍以上的計算性能和計算規模來解決產業的幾個關鍵的計算問題,例如:更高性能的AI訓練和推理,更高性能的實時光線追蹤,更高性能的編碼。
通信上,同時需要十倍以上的通信性能來解決通信帶寬與通信延時的問題,以便輔助高性能的異構加速計算,實現云與端的無縫協同。
生態上,更需要一套建設一套開發者協作體系和商業生態來創造可以影響到千行百業的開發者生態系統。我們在前面很多年都在解決前兩個問題,而目前正在解決第三個問題。
在過去的幾年時間里,阿里云通過神龍架構、GPU實例迭代,創新GPU超算集群等計算和產品手段來解決計算和通信性能挑戰的問題,通過大規模GPU產品商業化運營來解決GPU算力規模的問題。
在2021年云棲大會發布的第四代神龍架構在IO上也繼續實現了功能和性能上的巨大飛躍,實現了eRDMA大規模組網,并且把時延降低到最低5us,并且網絡IO使用硬件加速實現;VPC網絡可以實現5000萬PPS的吞吐和16us低延時通信。這意味著此后實現的虛擬人可以識別人類的更加細微的表情并且可以實現虛擬人的細微表情展現。
2021年我們還發布了第七代GPU實例,無論是XR及各類Verse用到的大規模多模態模型訓練和推理,還是實時3D渲染,實時光線追蹤,性能均實現大幅增長。
在計算規模層面,截止到去年5月,云上的GPU總算力已經超過1000PFLOPS,并且依然在高速增長,這也將成為我們未來創建數字虛擬世界基礎算力池的一部分。
雖然計算性能,通信性能,計算規模都實現了大幅度增長,但是生產關系與生產力的問題依然存在,我們需要建立一個相適應的協作生態體系。
03 持續創新為全社會輸出堅實算力
興旺一個行業,就要創新生產力和生產關系。我們希望借助云上的技術、產品和商業生態來實現,阿里云的基礎設施多年來在逐步完善,不斷為全社會提供更多優秀的IaaS產品,但在異構計算層面,還需要做更多。
異構加速計算通常難以使用的,這個相信每一個使用GPU或者FPGA做開發的開發者都有同感,我們在過去服務客戶的實踐中,通過創新的軟件和云服務來逐步解決這些問題。
例如:我們為提升用戶GPU計算中GPU的使用效率推出了AIACC來幫助用戶加速,在諸多大規模的AI訓練和推理場景中,通常會有50%到數倍的加速效果,幫助用戶降低TCO。我們還通過Windows 渲染容器的方式來解決實時渲染場景下的GPU計算彈性共享的問題等等。
用戶的共性問題我們通過代碼來解決,且逐漸沉淀為解決全行業問題的平臺工具和軟件。當前借助各領域合作伙伴的能力,在阿里云的軟硬件產品之上共建了解決全行業問題的生態產品,這是我們正在做的。依據長達一年的全行業溝通,我們把全行業的需求分為三層:通用層、行業層、生態層。
? 通用層:通用層是提供更加原子化的能力來幫助全行業在云上構建業務,比如:云XR平臺和云3D編輯器就是這一層面的關鍵產品。
? 行業層:關于行業層,我們的目標想法是為各行各業提供可以提升全行業生產效率的編輯器工具,通過編輯器工具,各行各業更加簡單、高效地創作出適合本行業的XR及數字孿生應用,通過這種方式來賦能全行業。我們也向全行業發出邀請,希望致力于解決某個行業潛在問題的伙伴能夠與我們展開合作,目前我們在這里積累了非常多的伙伴,他們擁有一流的產品,正在幫助很多行業創建本行業的XR及數字孿生應用。
? 生態層:生態層尤為重要,如果將行業層比作火箭的話,那生態層就是火箭的燃料,各行業在建設本行業XR及數字孿生應用時,需要大量的素材與數據資產,如何高效創造和使用這些數字資產顯得尤為重要,也是繁榮開發者社區的關鍵一環。
在構建這些能力的同時,我們依然會鞏固我們的IaaS產品,并且將其做得更好,我們會在基礎產品服務上一如既往地給我們的客戶提供持續的優質產品和服務。
我們再聚焦到產業看需求。上圖中有一個常見的應用場景,在媒體上這個經常與我們理解的XR及各類Verse概念是綁在一起的,而對以上場景目前的認知也還在視覺計算的范疇,這些場景來自于不同行業,幫助行業創造新的業務需求或者做生產力優化。雖然這些場景目前看上去極為復雜,但是當我們站在視覺計算的角度對以上場景做歸一化時,最終仍然會落到我們已經定義好的產品能力板塊上了。
上圖是我要重點介紹的關鍵產品部分之一:云XR平臺。
云XR平臺是當前最為直接將云、XR及數字孿生應用和XR終端鏈接起來的平臺服務,云XR平臺可以通過云與應用,云與端的標準接口實現事實上的產業標準統一,這一點對于產業發展有非常大的意義,對于供給側,大家在約定好的接口上開發產品,實現互操作,效率更高,而在應用側,用戶也不會擔心供應側的任何變動和升級會導致之前的投入不可用。
我們已經在這個平臺上為國內某高校客戶實現了云上的熱工仿真實驗室,學生可以在PC端或者平板上實現對發電廠各類能量轉換裝置進行仿真實驗,比如:操作汽輪機做實驗,操作變電站做實驗等等;我們也與創新的虛擬人客戶實現了云上數百人參加的虛擬人演唱會等等。當前已經有越來越多的產業和行業開始嘗試用云端XR方式做業務創新和產業升級,同時我們還在推動這個產品為更多行業賦能。
04 各行各業如何落地云端XR業務?
這里就引出了我們另一個基于生態伙伴的平臺產品:云實時3D編輯器平臺。
如大家所熟悉的,我們開發不同平臺的軟件,就需要不同平臺的代碼編輯器、代碼編譯器,開發XR平臺上的應用軟件,我們就需要實時3D的編輯器。但是,要使用這類軟件并不容易,開發者需要購買昂貴的高性能GPU工作站硬件,還需要購買實時3D編輯器的昂貴授權,這對于開發者,都是一筆極大的開銷。與此同時,這類的大型應用,通常需要一個團隊來完成,就需要隨時協同開發,并且開發過程中,諸多計算環節極其耗時,受限于GPU工作站的計算能力,開發者只能等待。
因此,我們與國際頂尖的實時3D編輯器軟件供應商正在推出聯合產品,以便將實時3D的開發環節也搬到云上,這樣開發者就可以在無任何環境依賴的前提下,快速展開業務,實現跨地域協同,并且實現耗時計算的快速計算。
原文鏈接
本文為阿里云原創內容,未經允許不得轉載。?
總結
以上是生活随笔為你收集整理的阿里云弹性计算对视觉计算的思考与实践的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: win11配置jdk环境变量
- 下一篇: Eclipse+Wildfly10 创建