日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

谷歌更强 NLP 模型 XLNet 开源:20 项任务全面碾压 BERT!

發布時間:2025/3/21 编程问答 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 谷歌更强 NLP 模型 XLNet 开源:20 项任务全面碾压 BERT! 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

谷歌更強 NLP 模型 XLNet 開源:20 項任務全面碾壓 BERT!

?

11 月份,谷歌研究團隊在 GitHub 上發布了萬眾期待的 BERT,它不僅在 11 項 NLP 測試中刷新了最高成績,甚至還表現出全面超越人類的驚人結果。但 BERT 帶來的震撼還未平息,今日又一個令眾多 NLPer 興奮的消息發布: CMU 與谷歌大腦提出的全新 XLNet 在 20 個任務上超過了 BERT 的表現,并在 18 個任務上取得了當前最佳效果!而更令人激動的是,目前 XLNet 已經開放了訓練代碼和大型預訓練模型。雷鋒網 AI 科技評論將其具體內容整理如下。

XLNet 信息發布

BERT 與 XLNet 的關系

與基于自回歸語言建模的預訓練處理方法相比,基于自編碼的預訓練處理方法(比如 BERT)具有良好的雙向上下文建模能力。然而,由于依賴于使用掩碼破壞輸入,BERT 忽略了掩碼位置之間的依賴關系,并出現了預訓練-微調( pretrain-finetune) 差異。

XLNet 則是基于 BERT 的優缺點,提出的一種泛化自回歸預訓練方法。它通過最大化因子分解順序所有排列的期望似然來實現雙向上下文的學習;通過自回歸公式克服了 BERT 的局限性,并將來自 Transformer-XL(最先進的自回歸模型) 的思想集成到預訓練中,在長文本表示的語言任務中表現出了優異的性能。

XLNet 誕生背景

首先,我們要理解兩個概念:自回歸 (AR) 語言建模和自編碼 (AE)。

無監督表示學習在自然語言處理領域非常成功。通常,這些方法首先在大規模無標記文本語料庫上對神經網絡進行預訓練,然后對下游任務的模型或表示進行微調。在這一共同的高層次思想下,不同的無監督預訓練目標在相關文獻中得到了探索。其中,自回歸語言建模和自編碼是兩個最成功的預訓練目標。

AR 語言建模是利用自回歸模型估計文本語料庫的概率分布。具體來說,給定一個文本序列 x = (x1, … ,xT),AR 語言模型將這種可能性分解為前向乘積或后向乘積。一個參數模型 (如神經網絡) 被訓練來對每個條件分布建模。由于 AR 語言模型僅被訓練為編碼單向上下文 (向前或向后),因此它在建模深層雙向上下文時并沒有產生效果。相反的是下游語言理解任務,通常需要雙向上下文信息。這導致了 AR 語言建模和有效的預訓練之間的差距。

給定相同輸入序列 x 但因子分解順序不同的情況下,預測 x3 的置換語言建模目標的說明

相比之下,基于 AE 的預訓練不執行顯式密度估計,而是旨在從輸入重構原始數據。而一個著名的例子就是 BERT,它采用了最先進的預訓練方法。給定輸入 token 序列,用一個特殊符號 [MASK] 替換其中的特定部分,并且訓練模型從損壞的版本中恢復原 token。

由于密度估計不是目標的一部分,BERT 可以利用雙向上下文進行重建。直接的好處就是這消除了 AR 語言建模中的雙向信息差距,從而提高了性能。然而,BERT 在預訓練使用的 [MASK] 等人工符號實際數據中并不存在,導致了預訓練的網絡差距。此外,由于預測的 token 在輸入中被重新掩蓋,BERT 無法像 AR 語言建模一樣使用乘積規則對聯合概率進行建模。

因此,針對現有語言預訓練目標的優缺點,CMU 與谷歌大腦提出了將 AR 和 AE 的優點充分結合的泛化自回歸預訓練模型 XLNet。

XLNet 詳解

首先,XLNet 不使用傳統 AR 模型中固定的前向或后向因式分解順序,而是最大化所有可能因式分解順序的期望對數似然。因為是對因式分解順序的排列操作,每個位置的上下文都可以由來自左右兩邊的 token 組成。在期望中,每個位置都要學會利用來自所有位置的上下文信息,即捕獲雙向上下文。

其次,作為一種泛化的 AR 語言模型,XLNet 不依賴于殘余數據。因此,XLNet 不受 BERT 的預訓練-微調差異的影響。同時,自回歸目標也提供了一種自然的方法來使用乘積規則對預測 token 的聯合概率執行因式分解,消除了 BERT 中做出的獨立性假設。

除了一個新的預訓練目標,XLNet 還改進了預訓練的架構設計。

受 AR 語言建模最新進展的啟發,XLNet 將 Transformer-XL 的分段重復機制和相對編碼方案集成到預訓練中,在較長文本序列的任務中提高了性能。需要注意的是,將 Transformer(-XL) 架構簡單應用于基于排列的語言建模是不起作用的,因為分解順序是任意的且目標是模糊的。作為一種解決方案,研究者們提出重新參數化 Transformer(-XL) 網絡,以消除歧義。

實驗結果

截至 2019 年 6 月 19 日,XLNet 在 20 個任務上超過了 BERT 的表現,并在 18 個任務上取得了當前最佳效果(state-of-the-art),包括機器問答、自然語言推斷、情感分析和文檔排序。

以下是 XLNet-Large 和 Bert-Large 的一些比較:

閱讀理解任務

文本分類任務

ClueWeb09-B 文檔排名任務

在最終的 20 項任務中,XLNet 的表現優于 BERT,并且在 18 項任務中取得了最先進的結果。

發布模型

截至目前,已提供以下模式:

XLNet-Large, Cased:24-layer, 1024-hidden, 16-heads,

每個.zip 文件包含三個項:

TensorFlow checkpoint(xlnet_model.ckpt),包含預先訓練的權重。

SentencePiece 模型 (spiece.model),用于 (de) 標記化。

一個配置文件 (xlnet_config.json),指定模型的超參數。

未來釋放計劃

后續開發者還計劃在不同的環境下繼續發布更多的訓練模型,包括:

基本模型——將在 2019 年 6 月底發布一個 XLNet-Base。

Uncased 模型——目前,Cased XLNet-Large 比 Uncased XLNet-Large 性能更好。開發者仍在觀察與研究,當得出結論時,他們將馬上發布 Uncased 模型。(預計時間不會太久)

在維基百科上進行微調的預訓練模型,這可用于維基百科文本的任務,如 SQuAD 和 HotpotQA。

其他超參數配置的預訓練模型,可以用于特定的下游任務。

與新技術關聯的預訓練模型。

相關鏈接

論文地址

https://arxiv.org/pdf/1906.08237.pdf

預訓練模型及代碼地址

https://github.com/zihangdai/xlnet

總結

以上是生活随笔為你收集整理的谷歌更强 NLP 模型 XLNet 开源:20 项任务全面碾压 BERT!的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 精品人妻一区二区三区四区不卡 | 亚洲天堂男 | 久久国产成人 | 成人精品一区二区三区电影 | 天天爱天天草 | 亚洲一区二区视频在线播放 | 91偷拍一区二区三区精品 | 国产精品手机视频 | 国产黄色免费网站 | 国产一级精品毛片 | 美女张开腿让男人操 | www.人人干| 亚洲射色| 青青草原免费观看 | 色中文| 日本不卡一二三区 | 国产精品自拍在线观看 | 精品人妻大屁股白浆无码 | 欧美丰满一区二区免费视频 | 日本欧美一本 | 粉色视频网站 | 亚洲国产成人精品女人 | 亚洲最大成人网站 | www.国产在线视频 | 能免费看av的网站 | 欧美一级片在线播放 | 美女午夜影院 | 亚洲国产精一区二区三区性色 | 九九热这里都是精品 | 中国女人av | 日韩 欧美 亚洲 | 精品美女一区 | 亚洲日本网站 | 黄色一级网| 日本福利视频导航 | 一女三黑人理论片在线 | 色吊丝中文字幕 | 97免费在线观看 | 日在线视频 | 日韩特黄毛片 | 亚洲欧洲日韩 | 久久黄色网络 | 日本一区二区在线 | 黄色一级片 | 国产蜜臀在线 | 婷婷激情四射 | 中文字幕人妻丝袜乱一区三区 | 亚洲不卡在线观看 | 日本精品一区二区三区四区的功能 | 福利片在线看 | 99精品久久 | 日本成片网 | 婷婷激情小说 | 亚洲18在线看污www麻豆 | www.男人的天堂 | 天堂在线视频 | 日韩成人在线网站 | 中文字幕亚洲专区 | 99爱国产 | 日韩中文在线视频 | 精品一区二区三区免费毛片 | 丝袜av在线播放 | 日干夜干 | 国产成人一区二区三区免费看 | 蜜臀尤物一区二区三区直播 | 久久澡 | 久久香焦 | 亚洲经典一区二区三区四区 | 手机在线看永久av片免费 | 不用播放器看av | 黄色视屏软件 | 一区二区 中文字幕 | 福利在线视频观看 | 夜色综合 | 打开每日更新在线观看 | 夜夜操操 | 欧美日日| 久久伊人热| 少妇被躁爽到高潮 | 三级黄在线观看 | 视频在线观看 | 亚洲七区 | 日本人の夫妇交换 | 伊人久久亚洲 | 国产精品自拍小视频 | 国产亚洲精品久久久久久无几年桃 | 久久久亚洲国产精品 | 亚洲精品一区二区三区四区 | 极品少妇视频 | www.超碰| 三级黄色图片 | 一区二区三区免费看视频 | 涩涩视频网| 91免费短视频 | 山外人精品影院 | 综合网五月 | 中文字幕另类 | 成人av资源| 久久无码精品丰满人妻 |