日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

算法全覆盖,还能玩星际争霸,开源决策智能平台OpenDILab面世

發布時間:2024/10/8 编程问答 56 豆豆
生活随笔 收集整理的這篇文章主要介紹了 算法全覆盖,还能玩星际争霸,开源决策智能平台OpenDILab面世 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

開源是推動人工智能技術進步的重要力量。

近年來,AI 開發者們也一直在享受著開源帶來的技術紅利:前沿算法、數據、AI框架、甚至算力。這些開源資源為開發者們帶來了極大的便利,而反過來,通過匯聚開發者們的力量,這些開源項目也得到了極大的發展。

在意識到開源的力量之后,國內高校、企業也紛紛加入到開源社區。

7 月 8 日,在 2021 世界人工智能大會上,上海人工智能實驗室就做出了開源新動作:開源決策智能平臺 OpenDILab

2021WAIC大會科學前沿全體會議上,上海人工智能實驗室青年科學家劉宇博士發布OpenDILab開源決策AI平臺

據介紹,它是首個覆蓋最全學術界算法和工業級規模的決策 AI 平臺。也就是說,OpenDILab 不僅實現了最全面的算法覆蓋,例如強化學習,還提供了豐富的工業級應用環境,可應用于自動駕駛、游戲競技等領域。

如今,OpenDILab 已經被放到 Github 上。就讓我們對此項目一探究竟。

GitHub:

https://github.com/opendilab/

為什么要開源OpenDILab?

首先,為什么要做這樣一個平臺??

我們知道,過去 10 年,感知 AI 已經讓機器具備了從「看清」到「看懂」的能力,例如,給定一張貓的圖片,機器能夠判別出這是一只貓。

然而相較于這種感知層面的人工智能,決策 AI 問題是一項更加復雜的任務,它需要進行推理、決策、規劃等。

因此,決策 AI 是下一代 AI 的重要方向已經是業界共識。

目前決策 AI 主要存在兩大難題:

一是決策類問題因涉及多模態數據空間、跨尺度計算邏輯、多領域算法融合,這些問題很難標準化。與感知類 AI 單純的視覺信息不同,決策類 AI 通常需要同時處理諸如圖像、語音、結構化數據等多種復雜模態的數據類型。此外,單機單卡與多機多卡甚至跨集群計算的決策 AI 計算邏輯也完全不同。不同任務間的最優算法配置也差別較大。

二是作為一個前沿領域,決策 AI 的問題定義和研究視角在學術界和工業界之間存在巨大差距,諸多新奇的學術算法缺少環境和計算 pipeline 上的通用性,很多情況下只能局限于 toy model 級別的實驗環境,無法轉化到真正的工業場景上去,而從工業界本身來看,如何將實際問題抽象為適合現有的決策 AI 算法解決的環境,仍是阻礙決策 AI 技術應用實踐的核心門檻。

針對決策 AI 的技術難題,以及產學研協同創新過程中的困難,上海人工智能實驗室開源了 OpenDILab 平臺。它首次將產業應用中對于訓練系統、環境接口、算法設計的需求與學術界進行了有效連接。

作為一套完備的決策 AI 訓練與組織框架,OpenDILab 平臺自頂而下覆蓋了應用層、算法層、訓練層和支持層,適配了從單機到服務器集群規模的全尺度高效訓練 pipeline。?

OpenDILab平臺概覽

·?應用層:涵蓋多種決策場景,支持多模態數據空間的表示和變換,并提供大量性能優異的算子,助力 AI 做出最優決策;

· 算法層:提供多種常用模塊化組件,可在此基礎上構建不同的算法模型,支持用戶多維度的擴展和定制,完成決策 AI 算法的大統一;

·?訓練層:內置多種類型的執行計算圖,并深度優化了相應數據吞吐和資源利用率,可為小到學術研究,大到工業級應用的多種規模問題提供支持;

· 支持層:嘗試了 CUDA 異構計算和決策 AI 算法的結合,而在資源調度方面,OpenDILab 可依據算法和資源,動態管理整個訓練過程,提供異常自動化維護等多種微服務。作為一個系統工程,OpenDILab 為 AI+SYSTEM 帶來了全新形態。

一鍵實現決策算法與應用

OpenDILab (beta) 開源后,研究者和開發者們可以訪問 github,獲取最強最全的決策 AI 算法 Zoo,查看自動駕駛、游戲 AI 等工業問題在 OpenDILab 平臺加持下的具體實踐,以及諸多決策 AI 系統設計和優化的相關組件。

在 OpenDILab(beta)的開源版本里,我們可以看到它已經開放了四個核心代碼庫,最底層的 DI-engine,致力于解決決策 AI 環境算力標準化的訓練問題;中層的算法抽象層 DI-zoo,提供了目前最全最強的決策 AI 算法集合。還有頂部應用生態層,開源了基于 DI-engine 的自動駕駛決策平臺 DI-drive 和面向策略游戲《星際爭霸II》的大規模分布式訓練平臺 DI-star。

DI-engine 是一個通用的決策智能引擎,不僅支持 DQN、PPO、SAC 等大多數基礎的深度強化學習(DRL)算法,而且支持諸多特定研究領域的算法,如多智能體 RL 中的 QMIX、逆向 RL 中的 GAIL 和探索和稀疏獎勵問題中的 HER,RND 等等。對于每種算法,可以從多種環境和多種訓練 pipeline 的角度探索決策 AI 技術的不同形態。

DI-zoo 則可以為開發者提供當前最全、最強的決策 AI 算法集,擁有包括強化學習、MARL、MCTS 等 20 多種跨領域決策 AI 算法,支持 10 多個決策 AI 環境,并原生集成了大量研究員的算法調優經驗。這為開發者省去了調參困擾,方便在統一平臺對比性能。

而說到應用層的兩個代碼庫:DI-star、DI-drive,可以說是研究決策 AI 最合適的場景。

從國際象棋、圍棋到麻將、斗地主,各類游戲一直都是 AI 挑戰的對象,而這些復雜的游戲也成為了研究 AI 技術的絕佳場景。星際爭霸 2 作為目前難度最高的游戲之一,為檢驗人工智能決策能力提供了合適的舞臺。

基于 DI-engine 的底層支持和大規模分布式深度強化學習訓練技術,DI-star 打造出了人類大師分段水平星際爭霸 2 智能體,并把完整的技術實現細節和與人機對戰測試(僅需 Windows 系統 + 1060 以上顯卡)開放給所有人,希望借此促進通用人工智能的研究。

同時 OpenDILab 團隊也希望借助 DI-star,匯聚更多社區開發者的力量優化大規模深度強化學習訓練效率等方面的問題,將 AlphaStar 級別的智能體設計簡化到原來的 1/20~1/30。

自動駕駛同樣也是當前人工智能的熱門研究方向。決策、規劃與控制是自動駕駛任務的大腦,被各大公司視作高度保密技術。DI-drive 是自動駕駛領域第一個開源的,人人可以參與的研究平臺。

DI-drive 支持各種模仿學習、強化學習等決策算法,支持多模態類型的輸入輸出,支持高度定制的可視化模塊,為自動駕駛和決策 AI 搭建了至關重要的橋梁。DI-drive 還自主研發設計了 Casezoo 這一從實車采集數據轉化而成的測試場景,在及貼近真實的駕駛環境中訓練和測試決策模型,促進自動駕駛領域仿真研究在實車環境中的推廣和應用。

未來,OpenDILab 還將提供諸如 AutoML、信控等更多的工業級生態應用,加速下一代人工智能的重大技術突破和創新應用的落地。

而對我們開發者來說,一個開源平臺是否有意義在于能為我們帶來哪些方面的增益,OpenDILab 平臺的開源也不例外。?

無論你是想入門決策 AI 的技術萌新,還是志在探索算法真理的研究員,又或是想應用決策 AI 技術到各類實際應用中的工程師,都可以通過 OpenDILab 平臺獲得在算法,系統,工程等方面的經驗和工具支持。而現今開源的 OpenDILab (beta) ,也正在期待更多的開發者使用、反饋并逐漸完善它,整個社區一起共同構建最強最好用的決策 AI 平臺。

Exploration and Exploitation,就從現在開始!

????

現在,在「知乎」也能找到我們了

進入知乎首頁搜索「PaperWeekly」

點擊「關注」訂閱我們的專欄吧

關于PaperWeekly

PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。

總結

以上是生活随笔為你收集整理的算法全覆盖,还能玩星际争霸,开源决策智能平台OpenDILab面世的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。