日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 运维知识 > windows >内容正文

windows

浪潮信息发布“源 2.0”基础大模型,千亿参数代码开源

發(fā)布時間:2023/11/28 windows 30 传统文化
生活随笔 收集整理的這篇文章主要介紹了 浪潮信息发布“源 2.0”基础大模型,千亿参数代码开源 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
感謝網(wǎng)友 航空先生 的線索投遞!

11 月 27 日消息,浪潮信息今日發(fā)布了“源 2.0”基礎(chǔ)大模型,并宣布全面開源。源 2.0 基礎(chǔ)大模型包括 1026 億、518 億、21 億等三種參數(shù)規(guī)模的模型。

據(jù)介紹,源 2.0 通過使用中英文書籍、百科、論文等高質(zhì)量中英文資料,降低了互聯(lián)網(wǎng)語料內(nèi)容占比。為了獲取中文數(shù)學(xué)數(shù)據(jù),浪潮信息清洗了從 2018 年至今約 10PB 的互聯(lián)網(wǎng)數(shù)據(jù),但僅獲取到了約 10GB 的數(shù)學(xué)數(shù)據(jù)。

為了更高效地獲得相對匱乏的高質(zhì)量中文數(shù)學(xué)及代碼數(shù)據(jù)集,源 2.0 采用了基于大模型的數(shù)據(jù)生產(chǎn)及過濾方法,在保證數(shù)據(jù)的多樣性的同時也在每一個類別上提升數(shù)據(jù)質(zhì)量。

算力方面,源 2.0 采用了非均勻流水并行的方法,綜合運用流水線并行 + 優(yōu)化器參數(shù)并行 + 數(shù)據(jù)并行的策略,讓模型在流水并行各階段的顯存占用量分布更均衡,避免出現(xiàn)顯存瓶頸導(dǎo)致的訓(xùn)練效率降低的問題。

源 2.0 在評測上進行了代碼生成、數(shù)學(xué)問題求解、事實問答方面的能力測試,測試結(jié)果顯示,源 2.0 整體表現(xiàn)處于中上水平。

源 2.0 采用全面開源策略,全系列模型參數(shù)和代碼均可免費下載使用。附 GitHub 頁面和論文鏈接:

代碼開源鏈接:

https://github.com/IEIT-Yuan/Yuan-2.0

論文鏈接:

https://github.com/IEIT-Yuan/Yuan-2.0/blob/main/docs/Yuan2.0_paper.pdf

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,所有文章均包含本聲明。

總結(jié)

以上是生活随笔為你收集整理的浪潮信息发布“源 2.0”基础大模型,千亿参数代码开源的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。