快讯 丨《麻省理工科技评论》中国发布大模型评测报告
生活随笔
收集整理的這篇文章主要介紹了
快讯 丨《麻省理工科技评论》中国发布大模型评测报告
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
8月16日,《麻省理工科技評論》中國發布中國大模型評測報告,從研發和商業化能力、外界態度以及發展趨勢等維度全方位檢測大模型的能力。
據悉,此次評測選取了訊飛星火、百度文心一言、商湯商量、阿里通義千問等中文大模型平臺代表展開。
評測使用的測試集包含600道題目,覆蓋了語言專項、數學專項、理科綜合、文科綜合、邏輯思維、編程能力、綜合知識、安全性共8個一級大類,126個二級分類,290個三級標簽,并針對問題的豐富性和多樣性做了優化。
評測整體水平結果顯示,前三位分別為:訊飛星火、百度文心一言以及商湯商量,得分率分別為81.5%、75.2%和68.3%,阿里通義千問則以得分率66.9%排名第四。
總結
以上是生活随笔為你收集整理的快讯 丨《麻省理工科技评论》中国发布大模型评测报告的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 癔症型人格障碍(癔症(表演)型人格)
- 下一篇: 海力士硬盘和三星硬盘怎么选 海力士硬盘和