日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 综合教程 >内容正文

综合教程

浪潮信息发布“源 2.0”基础大模型,千亿参数代码开源

發布時間:2023/12/4 综合教程 27 生活家
生活随笔 收集整理的這篇文章主要介紹了 浪潮信息发布“源 2.0”基础大模型,千亿参数代码开源 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

感謝網友 航空先生 的線索投遞!

11 月 27 日消息,浪潮信息今日發布了“源 2.0”基礎大模型,并宣布全面開源。源 2.0 基礎大模型包括 1026 億、518 億、21 億等三種參數規模的模型。

據介紹,源 2.0 通過使用中英文書籍、百科、論文等高質量中英文資料,降低了互聯網語料內容占比。為了獲取中文數學數據,浪潮信息清洗了從 2018 年至今約 10PB 的互聯網數據,但僅獲取到了約 10GB 的數學數據。

為了更高效地獲得相對匱乏的高質量中文數學及代碼數據集,源 2.0 采用了基于大模型的數據生產及過濾方法,在保證數據的多樣性的同時也在每一個類別上提升數據質量。

算力方面,源 2.0 采用了非均勻流水并行的方法,綜合運用流水線并行 + 優化器參數并行 + 數據并行的策略,讓模型在流水并行各階段的顯存占用量分布更均衡,避免出現顯存瓶頸導致的訓練效率降低的問題。

源 2.0 在評測上進行了代碼生成、數學問題求解、事實問答方面的能力測試,測試結果顯示,源 2.0 整體表現處于中上水平。

源 2.0 采用全面開源策略,全系列模型參數和代碼均可免費下載使用。附 GitHub 頁面和論文鏈接:

代碼開源鏈接:

https://github.com/IEIT-Yuan/Yuan-2.0

論文鏈接:

https://github.com/IEIT-Yuan/Yuan-2.0/blob/main/docs/Yuan2.0_paper.pdf

廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節省甄選時間,結果僅供參考,所有文章均包含本聲明。

總結

以上是生活随笔為你收集整理的浪潮信息发布“源 2.0”基础大模型,千亿参数代码开源的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。