日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

阿里来了位技术新童鞋,一秒K.O八位律师

發(fā)布時間:2024/9/3 编程问答 50 豆豆
生活随笔 收集整理的這篇文章主要介紹了 阿里来了位技术新童鞋,一秒K.O八位律师 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.


阿里妹導讀:批改作文、同聲翻譯、制作海報……人工智能技術已經越來越多地運用在我們的日常生活中。而在法務領域,除了國外LawGeex在多個法務領域的應用外,目前在國內暫無成熟運作產品。


最近,阿里巴巴信息平臺企業(yè)數據智能部的工程師們,悄悄解鎖了這項成就。下面我們一起來看看。


AI與法務,會擦出怎樣的火花?


日前在阿里巴巴內部,進行了這樣一場特殊的“比賽”。600份在線協議,8位專業(yè)律師用了一周時間完成審核,而人工智能僅用時1秒,并且在這600份協議中,標記出的問題準確率達到100%。


這是阿里巴巴信息平臺企業(yè)數據智能部的工程師們,自主研發(fā)的智能合同診斷系統,用AI代替法務進行互聯網在線協議的審核工作。究竟AI在法務領域如何運用?背后有哪些技術原理?以下是我們給出的解決方案。


背景


互聯網背景下的消費者權益保護成為大眾關注的新焦點。這其中就包括了客戶服務協議、用戶隱私協議等消費者與運營商簽署的互聯網在線協議問題。阿里巴巴因為業(yè)務線眾多,對于此類協議的審查與更新工作更是一項龐大工程。


目前人工審核一份在線協議的平均時長在30分鐘左右,并且由于文字量大、規(guī)則多,人工檢查不可能100%覆蓋,人工審核標準不夠統一。有沒有可能讓AI來代替法務進行審核工作?在這樣的背景下,智能合同診斷系統上線了。


這套智能合同診斷系統主要做兩件事,一是判斷出不該出現的內容(如:違反法律法規(guī)的違禁詞、侵犯消費者權限的條款、模糊表述等);二是判斷哪些是原本應該出現的內容,并給出修改建議或推薦用詞。


智能合同診斷系統檢查出風險點,并給出推薦表述


看似簡單,但實際在系統學習過程中卻困難重重:


1、法律語言表達和自然語言的差異性


目前普遍在做的NLP應用,大部分是基于自然語言進行處理。例如社交網絡語言,更加接近人們對話的用語表達。而法律用語和自然語言用語之間存在較大差異,法律語言通常有其特定領域的表達規(guī)范和邏輯,和我們通常的自然語言表述有較大差異。這就導致了現有的研究成果無法直接應用于法務領域,需要做特定領域的遷移。


2、技術和業(yè)務場景的鴻溝


如果不具備法務法律領域相關知識基礎,有好的NLP技術也不一定能在法務領域落地。能夠將法務領域需求抽象并和技術相結合,具有很大挑戰(zhàn),需要跨領域人才和多領域人才密切配合。


3、標注數據的稀缺性


在法務領域,數據十分稀缺,而且往往涉及到敏感信息和商業(yè)機密,導致了數據無法共享。有些場景僅有少量標注數據。


4、較高的準確性要求


法務領域對算法指標要求較高,特別有些場景對算法的召回率有嚴格要求,因為一旦漏掉關鍵信息有可能造成較大的法律風險;此外,法務很多場景對算法可解釋性要求較高,因此算法不但要知其然還要知其所以然。

?

解決方案


在搭建系統時,第一步就是針對法務領域建立行業(yè)詞庫和知識圖譜。


只有首先教會系統理解法律術語,而不是自然語言,接下來才能更好訓練系統去理解法律概念。基于阿里巴巴大量的在線協議、合同、訴訟等各種法律文書,采用大規(guī)模無監(jiān)督的短語挖掘方法 Phrase Mining[1,2] 能自動從文書中提取出行業(yè)關聯度較強的短語,例如:“包括但不限于”、“授權委托書”、“過失侵權行為”等;


同時,法務專家會根據特定業(yè)務場景梳理出業(yè)務規(guī)則,比如在在線協議領域,就標注出一份禁止用語清單,以及出現相關禁用語的對應推薦詞可供機器學習。比如:“一經公告、立即生效”的推薦表述為“公告之后的7日后生效”等。針對大量這些法務規(guī)則輸入,從技術角度解析為知識圖譜上的點,變?yōu)橛嬎銠C可以處理的格式。

?

詞的向量表示


基于大規(guī)模訓練的通用詞向量幾乎對所有NLP任務都有顯著幫助。而針對法務領域而言,由于有其特定的領域特性,我們在通用的詞向量基礎上,加入了大量法務領域文書的語料,使得學習到的詞向量在法務領域表現更為突出。


普通的詞向量模型大多采用 Word2Vec 或者 GloVe 訓練得到,最近的一項研究[3]發(fā)現基于 context 的詞向量 ELMo 能夠進一步提升幫助多個NLP 任務。



基于context的詞向量本質是語言模型的詞向量,詞向量不僅僅是詞本身的函數,也同時是句子里面其他詞以及序列位置的函數。在法務領域中我們也嘗試了ELMo 語言模型得到詞向量,提升了模型性能。

?

冷啟動和快速樣本標注


標注數據一直是機器學習問題最重要的要素之一,只有擁有了大量標注數據才能訓練得到比較好的模型。然而在法務領域,標注數據的獲取是非常昂貴的,需要具備法律專業(yè)的人士進行標注。


為了取得效率和成本的權衡,我們首先基于專家輸入的規(guī)則和知識圖譜,構建了基于規(guī)則系統的自動標注服務,能夠對存量數據進行自動打標。另一方面,可以替換關鍵詞,自動生成標注數據。例如:“一經公告、立即生效”,可以將“立即”替換為“立刻”、“立馬”、“即刻”等,通過這種方式可以生成大量的標注數據。


主動學習。規(guī)則畢竟是有限的,雖然可以解決一部分問題,但是無法解決模型的泛化能力,最終還是需要依賴一部分人工標注。為了減少人工標注成本,可以采用主動學習方法。每次僅需要人工標注最不確定的那些少量樣本就可以很大程度提升模型的性能。


多模型組合


文本分類技術也經歷了從傳統基于規(guī)則、人工特征到目前基于深度學習的技術演變過程。目前比較流行的技術方案是基于RNN的序列模型、基于CNN的模型,以及在此基礎上演化而來的各種變種,比如結合注意力(attention)機制,用預訓練的詞嵌入(Word Embedding)等方法。



在法務垂直領域中,我們利用 ELMo 構建了領域特性的詞向量作為模型的輸入,針對在線協議審查這一具體問題設計了一種結合CNN和RNN的深度神經網絡:C-GRU模型。不僅充分捕捉了核心詞與周圍詞的關系,也解決了長句依賴問題。


深度學習模型雖然能較好解決違規(guī)表述的分類問題,但是由于模型對于用戶而言是黑盒,可解釋性差。在線協議智能審核不僅要找到違規(guī)的條款表述,還需要定位到具體哪些詞語引起的,以及需要改成什么樣的才是推薦的表述。


因此我們的最終方案采取深度學習模型負責高召回,將所有可能產生違規(guī)表述的條款檢測出來。然后采用句法分析和規(guī)則方法對條款進行解析,定位到具體違規(guī)表述的位置和推薦表達。這種方案的優(yōu)點是利用深度學習提高召回率,用規(guī)則進行精確定位。

?


目前在線協議AI診斷系統除了極大提升協議審核效率,實現秒級審核速度,平均準確率在94%以上,每年相當于節(jié)省130人日的工作量。

?

未來規(guī)劃


近年來,以深度學習和自然語言處理為代表的人工智能技術取得巨大突破,也開始在法律智能領域嶄露頭角,受到學術界和產業(yè)界的廣泛關注。智能合同診斷只是我們在智能法務領域的第一步探索,除此之外,更多在合同、訴訟文書以及裁決文書上的工作正在進行中。

?

在技術上,我們進一步和阿里巴巴機器智能技術(MIT) 合作共建,加強在行業(yè)知識圖譜構建、機器閱讀理解以及信息抽取技術在法律領域應用的研究與探索。沉淀法律領域基礎數據資源,構建領域特點的自然語言處理平臺,共同服務于多樣化的法律業(yè)務中。

?

除了自然語言處理技術之外,我們還會在音視頻技術上加大投入,如圖像識別,光學字符識別(OCR)、手寫字符識別、ASR等。用于處理不同類型的法律材料,解決自然語言處理上游多源信息輸入問題。我們的最終目標是構建全鏈路全能力的法務AI能力。


相信法務AI能力的建設和完善能夠服務于廣大普通用戶、律師、法院等法律行業(yè)從業(yè)者。



阿里巴巴信息平臺事業(yè)部-企業(yè)數據智能團隊,集數據,算法,產品為一體,擁有文本,運籌,視覺等多類別AI能力,通過發(fā)掘數據內在價值,提升企業(yè)智能化管理水平。


團隊成員曾活躍于TREC QA Track,LFW(Labeled Faces in the Wild),ACM/ICPC等各大賽事,博士占比25%。


歡迎更多勇于挑戰(zhàn)的算法牛人加入我們,一起發(fā)現數據之美,構建企業(yè)大腦。

?

點擊信息平臺事業(yè)部即可查看招聘崗位具體信息,投遞簡歷。


參考文獻:

[1] El-Kishky et al., 2014, Scalable Topical PhraseMining from Text Corpora

[2] Liu et al., 2015, Mining Quality Phrases from MassiveText Corpora

[3] Matthew E. Peters,?Mark Neumann,?Mohit Iyyer,?Matt Gardner,?Christopher Clark,?Kenton Lee,?Luke Zettlemoyer. DEEP CONTEXTUALIZEDWORD REPRESENTATIONS. ICLR'18

總結

以上是生活随笔為你收集整理的阿里来了位技术新童鞋,一秒K.O八位律师的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 欧美日日 | 免费中文字幕视频 | www国产| 久久久久亚洲视频 | 三级在线国产 | 尤物91| 五月色丁香 | 婷婷四月 | 美腿丝袜一区二区三区 | 91一区二区三区在线观看 | 妖精视频在线观看免费 | 伊人资源 | 国产精品夜夜爽张柏芝 | 日韩在线三级 | 欧美孕妇性xx | 手机在线看永久av片免费 | 国产激情视频网站 | 中文字幕av第一页 | 成年人在线视频网站 | 一区二区三区免费 | 午夜国产 | 国产一区不卡在线 | 麻豆资源 | 91在线最新 | 精品欧美一区二区三区久久久 | 五月激情久久 | 亚洲国产精品一区二区尤物区 | 色久在线| 韩国三级hd两男一女 | 日韩不卡在线视频 | 国产精品4区 | 巨大乳の揉んで乳榨り奶水 | 日韩一区免费 | 日韩五月| 日本不卡视频在线播放 | 免费看日产一区二区三区 | 欧美绿帽交换xxx | 一本色道久久综合亚洲精品按摩 | 青青草免费公开视频 | 中文字幕亚洲欧美日韩 | 国产噜噜噜噜久久久久久久久 | 成人免费在线视频观看 | 欧美日韩在线播放 | 国产一区二区三区18 | 我看黄色一级片 | 综合av第一页 | 欧洲精品免费一区二区三区 | 成人亚洲免费 | 国产激情网址 | 人人91| 天天玩天天干 | 欧美中文字幕在线视频 | 老妇女性较大毛片 | 亚一区| 婷婷免费| 爱就操 | 日本少妇xxxx软件 | 国产精品天天操 | 久久久久久久久久久久久久久久久 | 亚洲一级视频在线观看 | 少妇激情在线 | 女人十八毛片嫩草av | 黄色69 | 午夜一二三 | 亚洲黄色片子 | 91丨porny丨九色 | 亚洲 欧美 中文字幕 | 和美女啪啪 | 久久黄色视 | 免费禁漫天堂a3d | 久久人人爽人人爽人人 | 婷婷射图| 久久国产网 | 好吊色网站| 婷婷五月色综合 | 天天综合久久 | 欧美黄色a级大片 | 青草视频在线免费观看 | 熟女毛毛多熟妇人妻aⅴ在线毛片 | av av在线| 182tv福利视频 | 欧美日韩观看 | 人人妻人人玩人人澡人人爽 | 欧美手机在线观看 | 青青青av | 国产一区不卡在线观看 | 激情综合网站 | 最近最经典中文mv字幕 | 亚洲影视中文字幕 | 国产欧美大片 | 亚洲在线一区二区 | 99这里都是精品 | 尤物视频在线观看国产性感 | www.狠狠爱 | 国内毛片毛片毛片毛片毛片 | 狠狠干2018| 欧美91精品久久久久国产性生爱 | 欧美精品一区二区三区蜜臀 | 大乳巨大乳j奶hd |