日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Facebook开源NLP建模框架PyText,从论文到产品部署只需数天

發(fā)布時間:2025/6/17 编程问答 28 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Facebook开源NLP建模框架PyText,从论文到产品部署只需数天 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

選自code.fb

作者:AHMED ALY HEGAZY、CHRISTOPHER DEWAN

機器之心編譯

參與:淑婷、張倩


Facebook AI Research(FAIR)今天宣布推出 PyText 的開源版本,它是這家公司正在使用的主要自然語言處理(NLP)建模框架,目前每天在為 Facebook 及其應用程序系列的用戶提供超過 10 億次 AI 任務處理。


Yann LeCun 對此介紹道,「PyText 是一個工業(yè)級的開源 NLP 工具包,可用于在 PyTorch 中開發(fā) NLP 模型,并通過 ONNX 部署。其預訓練模型包括文本分類、序列標注等。」


項目地址:https://github.com/facebookresearch/pytext



為了降低人們創(chuàng)建、部署自然語言處理系統(tǒng)的難度,Facebook 開源了一個建模框架——PyText,它模糊了實驗與大規(guī)模部署之間的界限。這一框架基于 PyTorch,可以為 NLP 的發(fā)展帶來以下好處:


  • 提供簡化的工作流程,加速實驗。

  • 提供一大批預構建的模型架構和用于文本處理和詞匯管理的工具,以促進大規(guī)模部署。

  • 提供利用 PyTorch 生態(tài)系統(tǒng)的能力,包括由 NLP 社區(qū)中的研究人員、工程師預構建的模型和工具。


AI 研究人員和工程師現在可以利用 PyText 加快實驗進度,部署用于文檔分類、序列標注、語義分析、多任務建模及其他任務的系統(tǒng)。利用該框架,Facebook 在幾天內就實現了 NLP 模型從理念到完整實施的整個過程,還部署了依賴多任務學習的復雜模型。現在,PyText 被 Facebook 用于超過十億次的日常預測工作,這表明該框架可以以產品級的規(guī)模運行,能夠滿足嚴格的延遲要求。


在優(yōu)化框架時,神經網絡工程師一直都在實驗和生產之間進行權衡,NLP 系統(tǒng)的工程師更是如此。NLP 系統(tǒng)需要創(chuàng)建、訓練、測試數十個模型,其結構具有動態(tài)特性。以研究為導向的框架可以提供一個簡單的 eager-execution 接口,加快創(chuàng)建動態(tài)高級模型的進程,但如果將它們部署到生產,就會面臨延遲多、內存占用多的困境。針對生產進行優(yōu)化的框架可以通過將模型展示為靜態(tài)圖來加快部署,但這種方法增加了創(chuàng)建文本序列動態(tài)表征的難度。PyTorch 1.0 是一個統(tǒng)一的框架,縮短了從研究到生產的路徑。而基于 PyTorch 的 PyText 則著眼于滿足 NLP 建模的特定需求。


此次一起開源的還有一些用于大規(guī)模訓練和部署 PyText 模型的預訓練模型及教程。


走向更好的 NLP


AI 研究人員及工程師擁有許多可以理解語言的系統(tǒng)應用,而且這些應用還在增加。Facebook 利用 NLP 向用戶提供相關性更強的內容,為他們提供更加強大的可用功能、標記違規(guī)動態(tài)、翻譯等其它服務。會話 AI 的前沿研究進展迅速,PyText 可以進一步加快這一進程,同時提高產品質量。PyText 目前已經部署到 Facebook 的視頻通話設備 Portal 以及 Messenger 的 M suggestions 功能中。此外,Facebook 還在探索 PyText 在會話 AI 領域的其它應用。


借助 PyText,Portal 可以支持「Hey Portal」語音命令中的組合和嵌套調用查詢。這一功能使得用戶可以使用類似「給我爸打電話」這樣的語音命令。這種命令要求系統(tǒng)理解呼叫者與被呼叫者之間的關系,利用了 Facebook 論文《Semantic Parsing for Task Oriented Dialog using Hierarchical Representations》中提到的語義分析技術。


Facebook 已經利用 PyText 快速迭代 Portal NLP 模型的持續(xù)改進,如組裝、條件隨機域及用在所有領域的混合模型。這種做法將 Facebook 核心領域模型的準確率提高了 5 到 10 個百分點。他們還借助 PyText 對分布式訓練的支持將 Portal 的訓練時間縮短到原來的 1/3 到 1/5。


利用 PyText 實現的快速迭代還提高了 Facebook NLP 模型的效率和可擴展性。在 Portal、Messenger 及其它許多用例中,模型需要實時運行,以提供快速響應。此外,Facebook 還需要大規(guī)模運行的高效 NLP 系統(tǒng)。PyText 降低了 Facebook 工程師在系統(tǒng)中部署實時高級 NLP 技術的難度,這些系統(tǒng)有數十億使用多種不同語言的用戶。


PyText 以 Facebook 的其它 NLP 系統(tǒng)為基礎,并對其它系統(tǒng)進行補充。例如,它可以和 Facebook 的 fastText library 一起使用。研究人員和工程師可以在 fastText 中訓練詞嵌入,然后將其應用到 PyText 中。


PyText 還針對 DeepText 進行了一些重要改進,如后者無法實施動態(tài)圖。由于模型中的有條件執(zhí)行和自定義數據結構,PyText 中的一些語義解析和多任務學習模型無法利用 DeepText 構建。PyText 還加速了訓練,因為它可以利用 GPU 及更易實施的分布式訓練。Facebook 打算將 PyText 作為未來主要的 NLP 平臺。


靈活的模塊化設計


PyText 是建立在 PyTorch 上的,它可以連接 ONNX 和 Caffe2。借助 PyText,AI 研究人員和工程師可以把 PyTorch 模型轉化為 ONNX,然后將其導出為 Caffe2,用于大規(guī)模生產部署。


它為模型組件提供了一個靈活的模塊化工作流程,具有可配置的層和可擴展接口。PyText 可作為端到端平臺,開發(fā)者可以立即應用它來創(chuàng)建整個 NLP 流程。而其模塊化結構也允許工程師將單個組件整合到現有系統(tǒng)中。


每個組件所扮演的角色以及與其它組件的交互視任務而定。例如,數據處理程序組件和訓練器、損失、優(yōu)化器組件一起訓練模型。但數據處理程序也會和預測器、模型交互來執(zhí)行推斷(在真實環(huán)境中運行訓練好的模型)。這種模塊化方法增強了 PyText 的多功能性,該平臺幾乎可被用于從研發(fā)到生產過程中的任何環(huán)節(jié),從零開始構建整個 NLP 系統(tǒng),或者對現有系統(tǒng)進行修改。


PyText 還具備其它改進 NLP 工作流程的功能。該框架支持分布式訓練,這可以極大加速需要多次運行的 NLP 實驗。它還支持多任務學習,以同時訓練多個模型。對訓練的其它優(yōu)化包括:


  • 便攜性。PyText 模型是建立在 PyTorch 之上的,可以輕松在 AI 社區(qū)的不同組織之間共享。

  • 預構建模型。PyText 具有專注于各種常見 NLP 任務(如文本分類、語義解析和語言建模)的多種模型,因此可以輕松地在新數據上使用預構建模型,僅需極少的額外工作。

  • 上下文模型。為了提高對各種 NLP 任務中的會話理解,我們可以使用用 PyText 利用上下文信息,例如會話線程的早期部分。Facebook 在 PyText 中構建了兩種上下文模型:用于意圖標注任務的 SeqNN 模型和用于兩個任務聯(lián)合訓練的 Contextual Intent Slot 模型。在 Facebook 的測試中,引入上下文信息使 M suggestions 在多個數據集上產生了顯著的性能提升。


至于生產中的優(yōu)化推斷,PyText 使用 PyTorch 1.0,通過優(yōu)化的 Caffe2 執(zhí)行引擎導出模型進行推斷。Native PyTorch 模型需要 Python 運行時,而由于 Python 的 Global Interpreter Lock 的多線程限制,這種運行時無法充分擴展。導出至 Caffe2 則提供了高效的多線程 C++后端,以高吞吐量地高效服務巨大流量。PyText 的其它功能也使將模型移動并部署到生產中變得更加容易,如:


  • 適用于研究和生產的 NLP 工作的通用資源,如用于訓練和推斷的簡單 API,還有用于訓練和推斷的文本預處理。

  • 詞匯管理,因此 PyText 可以在模型導出至 Caffe2 以后將詞匯添加到模型中。

  • 增加了對字符串張量的支持,以便在訓練和推斷中有效處理文本。


從研究到生產變得更容易



PyText 的誕生最初是為了創(chuàng)建一個新的 NLP 模型,它為降低創(chuàng)建新模型、編輯現有模型的難度提供了必要的抽象概念。訓練和評估這些模型非常簡單,然后執(zhí)行參數掃描來確定最佳模型。PyText 旨在讓開發(fā)者專注于其想要改變的特定組件或模型,并在系統(tǒng)的其余部分使用「開箱即用」組件。


由此產生了一個可以在 Python 環(huán)境下運行的 PyTorch 模型。借助 PyText 的 Python 服務,AI 開發(fā)者可以通過部署其模型和接收一小部分使用該產品的用戶的流量來快速獲得在線指標。



一旦工程師對模型的性能感到滿意,那他/她就可以利用 PyText 中的 exporter 模塊,通過 ONNX 把模型導出至 Caffe2。然后 Caffe2 可以在 C++ 處理產品流量的推斷服務中評估和部署。


這個代碼示例展示了如何使用 ONNX 將模型導出至 Caffe2,預先添加一個運算符(如 string2id),然后執(zhí)行任何必要的后處理。


PyText 和 NLP 工具的未來


在 Facebook 內部的部署證明,PyText 可以幫助工程師加快 NLP 建模方法的迭代速度,然后快速將其擴展到生產中。NLP 領域規(guī)模龐大,發(fā)展迅速,所以 Facebook 將繼續(xù)提升 PyText 測試新最佳模型的能力,并高效、大規(guī)模部署這些模型。


由于在移動設備上部署復雜 NLP 模型仍是一大挑戰(zhàn),Facebook 正在努力為設備內置(on-device)模型構建端到端的工作流程。其近期的計劃包括支持多語言模型和其它建模能力,使模型更容易調試,進一步優(yōu)化分布式訓練。


更多關于 PyText 的細節(jié)請參考:https://research.fb.com/publications/pytext-a-seamless-path-from-nlp-research-to-production/?


原文鏈接:https://code.fb.com/ai-research/pytext-open-source-nlp-framework/



總結

以上是生活随笔為你收集整理的Facebook开源NLP建模框架PyText,从论文到产品部署只需数天的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 男人操女人免费网站 | 久草观看视频 | 日本成人片网站 | 日产精品久久久 | 国产激情精品一区二区三区 | av波多野吉衣 | 91网址在线 | 亚洲蜜桃精久久久久久久久久久久 | 日韩一区二区三区三四区视频在线观看 | 国产成人免费 | 中国黄色一级片 | 亚洲一区二区三区四区五区午夜 | 麻豆国产尤物av尤物在线观看 | 日本黄区免费视频观看 | 国产精品视频全国免费观看 | 免费亚洲网站 | 国产肉体xxxx裸体784大胆 | 黄色污网站在线观看 | xxxxx在线| 国产成人无码a区在线观看视频 | 自拍99页 | 波多野结衣www | 欧美色综合网 | 91在线视频国产 | 全部毛片永久免费看 | 伊人免费 | 伊人狼人综合 | 日本肉体xxxx裸体137大胆图 | 在线看的av| 国产 中文 字幕 日韩 在线 | 欧美一级片a | 美女扒开腿男人爽桶 | 免费大片黄在线观看 | 在线观看污网站 | 亚洲精品aⅴ中文字幕乱码 国产精品调教视频 | 又污又黄的网站 | 特色黄色片 | 伊人手机在线视频 | 国产精品51麻豆cm传媒 | 日韩精品乱码久久久久久 | 国产午夜精品免费一区二区三区视频 | 日本 片 成人 在线 九色麻豆 | 神马午夜激情 | 99青草| 玖玖爱资源站 | 中文字幕第18页 | 亚洲区视频在线观看 | 久久春色 | 成人爱爱 | 韩国av网| 欧美国产精品一区二区三区 | 成人影片在线播放 | 观看av在线 | 爱久久视频 | 久久综合在线 | 播放男人添女人下边视频 | www.亚洲色图 | 欧美 日韩 综合 | 国产一区二区自拍视频 | 山村淫强伦寡妇 | 久久国产香蕉 | 中文字幕超碰在线 | 韩国av中文字幕 | 欧美精品中文 | 99re视频在线观看 | 九一福利视频 | 懂色av成人一区二区三区 | 牛牛影视一区二区 | 日本精品在线 | 都市激情 亚洲 | 噜噜噜久久久 | 成人免费观看视频 | 亚洲精品国产精品乱码 | 亚洲精品理论片 | 欧美日韩人妻精品一区二区 | 亚洲免费黄网 | 国产99久久九九精品无码 | 禁果av一区二区三区 | 午夜国产在线视频 | 欧美大白屁股 | 美女露胸露尿口 | 丁香激情六月 | 精品人妻二区中文字幕 | 中国一级特黄毛片大片 | 成人一级生活片 | 亚洲av无码一区二区三区性色 | 黄色一级片在线看 | 热久久最新 | av一卡| 全部孕妇毛片 | 亚洲美女屁股眼交3 | 欧美妞干网 | 精品久久久久久久久中文字幕 | 天天看夜夜| 大j8黑人w巨大888a片 | 国模视频在线 | 在线免费观看a级片 | 亚洲成人精品在线播放 | 给我看免费高清在线观看 |