當前位置：首頁 > 编程资源 > 综合教程 >内容正文

综合教程

快讯丨《麻省理工科技评论》中国发布大模型评测报告

發布時間：2024/1/3 综合教程 30 生活家

生活随笔收集整理的這篇文章主要介紹了快讯丨《麻省理工科技评论》中国发布大模型评测报告小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

8月16日，《麻省理工科技評論》中國發布中國大模型評測報告，從研發和商業化能力、外界態度以及發展趨勢等維度全方位檢測大模型的能力。

據悉，此次評測選取了訊飛星火、百度文心一言、商湯商量、阿里通義千問等中文大模型平臺代表展開。

評測使用的測試集包含600道題目，覆蓋了語言專項、數學專項、理科綜合、文科綜合、邏輯思維、編程能力、綜合知識、安全性共8個一級大類，126個二級分類，290個三級標簽，并針對問題的豐富性和多樣性做了優化。

評測整體水平結果顯示，前三位分別為：訊飛星火、百度文心一言以及商湯商量，得分率分別為81.5%、75.2%和68.3％，阿里通義千問則以得分率66.9%排名第四。

以上是生活随笔為你收集整理的快讯丨《麻省理工科技评论》中国发布大模型评测报告的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。