當前位置：首頁 > 编程资源 > 综合教程 >内容正文

综合教程

谷歌大模型团队并入 DeepMind，誓要赶上 ChatGPT 进度

發布時間：2023/12/15 综合教程 35 生活家

生活随笔收集整理的這篇文章主要介紹了谷歌大模型团队并入 DeepMind，誓要赶上 ChatGPT 进度小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

為應對 ChatGPT，谷歌在大模型方面的動作還在繼續。

最新消息，其旗下專注語言大模型領域的“藍移團隊”（Blueshift Team）宣布，正式加入 DeepMind，旨在共同提升 LLM 能力！

DeepMind 科學家們在推特下面“列隊歡迎”，好不熱鬧~

藍移團隊隸屬于谷歌研究，和谷歌大腦實驗室同等級。

之前谷歌耗時 2 年發布的大模型新基準 BIG-Bench，就有該團隊的重要貢獻。

還有谷歌 5400 億大模型 PaLM，背后也有藍移團隊成員提供建議。

綜合此前消息，DeepMind 表示要在今年發布聊天機器人麻雀（Sparrow）內測版本。

如今又有擅長大模型研究的團隊加入，強強聯手，或許會加快谷歌應對 ChatGPT 的腳步？

這下有好戲看了。

藍移團隊是誰？

據官網介紹，藍移團隊主要關注的研究點是如何理解和改進大語言模型的能力。

他們專注于了解 Transformer 的局限性，并挑戰將其能力擴展到解決數學、科學、編程、算法和規劃等領域。

具體可分為如下幾方面分支。

團隊的代表性工作有數學做題模型 Minerva。

它曾參加數學競賽考試 MATH，得分超過計算機博士水平。

綜合了數理化生、電子工程和計算機科學的綜合考試 MMLU-STEM，它的分數比以往 AI 高了 20 分左右。

并且它的做題方法也是理科式的，基于谷歌 5400 億參數大模型 PaLM，Minerva 狂讀論文和 LaTeX 公式后，可可以按照理解自然語言的方式理解數學符號。

作者透露，讓該模型參加波蘭的數學高考，成績都超過了全國平均分數。

還有藍移團隊曾和 MIT 的科學家一起，通過訓練大模型學會程序員 debug 時“打斷點”的方式，就能讓模型讀代碼的能力大幅提升。

還有谷歌耗時 2 年發布的大模型新基準 BIG-Bench，藍移團隊全部成員均參與了這項工作。

BIG-bench 由 204 個任務組成，內容涵蓋語言學、兒童發展、數學、常識推理、生物學、物理學、社會偏見、軟件開發等方面的問題。

以及如上提到的谷歌大模型 PaLM，藍移團隊成員 Ethan S Dyer 也貢獻了建議。

官網顯示，藍移團隊目前有 4 位主要成員。

Behnam Neyshabur 現在是 DeepMind 的高級研究員。他在豐田工業大學（芝加哥）攻讀了計算機博士學位，后來在紐約大學進行博士后工作，同時是普林斯頓大學高等研究理論機器學習項目組的成員。

研究領域是大語言模型的推理和算法能力、深度學習和泛化等。

Vinay Ramasesh 在加州大學伯克利分校獲得物理學博士學位，曾致力于研究基于超導量子比特的量子處理器，碩士畢業于麻省理工學院。

最近他主要在研究語言模型，職位是研究科學家。

Ethan Dyer 博士畢業于麻省理工學院，2018 年加入谷歌工作至今。

Anders Johan Andreassen 同樣是物理專業出身，博士畢業于哈佛大學。在哈佛大學、加州大學伯克利分校都做過博士后，2019 年起加入谷歌。

谷歌還有多少后手？

這次藍移團隊的調動，也不免讓外界猜測是否是谷歌為應對 ChatGPT 的最新舉措。

ChatGPT 引爆大模型趨勢后，谷歌幾乎是最先打響“阻擊戰”的大廠。

盡管加急發布的 Bard 效果確實有失水準，但這并不意味著谷歌會就此喪失競爭力。

誠如 OpenAI 之于微軟，谷歌也有 DeepMind。

DeepMind 還是上一輪 AI 浪潮的引爆者。

消息顯示，DeepMind 手里也有聊天機器人。

去年 9 月，他們介紹了一個對話 AI 麻雀（Sparrow），它的原理同樣是基于人類反饋的強化學習，能夠依據人類偏好訓練模型。

DeepMind 創始人兼 CEO 哈薩比在今年早些時候說，麻雀的內測版本將在 2023 年發布。

他表示，他們將會“謹慎地”發布模型，以實現模型可以開發強化學習功能，比如引用資料等 —— 這是 ChatGPT 不具備的功能。

但具體的發布時間還沒有透露。

藍移團隊的加入公告中提到，他們是為了加速提升 DeepMind 乃至谷歌的 LLM 能力，不知這一動向是否會加速該對話模型的發布。

與此同時，谷歌也沒有把目光完全局限在自家開發能力上。

本月初，劈柴哥重磅宣布，斥資 3 億美元，緊急投資 ChatGPT 競品公司 Anthropic—— 由 GPT-3 核心成員出走創辦。

1 月底，該公司內測聊天機器人 Claude，

這是一個超過 520 億參數的大模型，自稱基于前沿 NLP 和 AI 安全技術打造。

它同 ChatGPT 一樣，靠強化學習（RL）來訓練偏好模型，并進行后續微調。

但又與 ChatGPT 采用的人類反饋強化學習（RLHF）不同，Claude 訓練時，采用了基于偏好模型而非人工反饋的原發人工智能方法（Constitutional AI），這種方法又被稱為 AI 反饋強化學習（RLAIF）。

如今，Claude 尚未作為商業產品正式發布，但已有人（如全網第一個提示工程師 Riley Goodside）拿到了內測資格。有人說效果比 ChatGPT 要好。

目前，這家公司的最新估值已經達到 50 億美元。

總而言之，谷歌雖然在 Bard 上栽了跟頭，但也沒把雞蛋放在一個籃子里。接下來它在大模型上還有哪些新動作？還很有看頭。

參考鏈接：

[1]https://twitter.com/bneyshabur/status/1629150056715816962
[2]https://research.google/teams/blueshift/
[3]https://www.deepmind.com/blog/building-safer-dialogue-agents

本文來自微信公眾號：量子位（ID：QbitAI），作者：明敏

總結

以上是生活随笔為你收集整理的谷歌大模型团队并入 DeepMind，誓要赶上 ChatGPT 进度的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：特斯拉中国：今年生产的 Model Y
下一篇：华擎 AM5 主板现已支持锐龙 7000