日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

一个问题就可以辨别真假NLP(自然语言处理)研究者

發布時間:2024/7/5 编程问答 41 豆豆
生活随笔 收集整理的這篇文章主要介紹了 一个问题就可以辨别真假NLP(自然语言处理)研究者 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

╮(╯▽╰)╭哎,自從人工智能火了以后,最近自稱NLP研究者的人越來越多了,然而這其中的大忽悠有多少小夕就不想多說了。如果連自己在哪個領域、哪個學科搞研究都不懂的話,你相信他真的是這個領域的研究者喵?反正小夕不信╮(╯▽╰)╭

所以,這個問題就是:“自然語言處理跟自然語言理解和計算語言學是不是一個東西呢?”

在有的科普文,甚至書籍中,將自然語言處理、自然語言理解、計算語言學看作是一個東西,其實是很不準確的吶!小夕今天就講一講被大眾媒體和諸多自稱NLP領域的學者混為一談的幾個概念。

自然語言理解(NLU)

在60年前人工智能誕生之初,就提出了自然語言理解,并且將其作為人工智能最重要的研究方向。自然語言理解是為了探索人類語言能力和語言思維活動的本質,并模仿人類語言的認知過程來讓計算機對人類語言進行理解和處理。其是語言學、計算機科學、認知科學、信息論和數學等多學科基礎上形成的交叉學科。而其目標是讓計算機真正的理解人類語言,進而進行處理與表達等。而判斷計算機是否理解自然語言的標準就是“圖靈測試”。

圖靈測試在自然語言理解領域來說即:讓一個人類提出問題,回答他的可能是人也可能是計算機。在計算機給出回答后,如果提問者分不清楚這是人還是計算機的回答,則認為計算機理解了人類語言,廣義的說計算機具備了智能。

計算語言學(CL)

計算語言學的側重點是數學建模。將人類語言建模為計算機可以有效計算的算法。也就是說,出發點是語言學,而做的是將語言學中的嚴謹理論借鑒并轉為計算機算法,是一門非常理性的學科,即一門純理論的學科。同時,這也是基于規則的自然語言處理方法的理論核心。

自然語言處理(NLP)

自然語言處理則是面向具體的應用場景,從系統實現與工程的角度出發來對語言文本進行加工與處理。它不一定用數學方法,但是總歸是要用某種方法來解決某個特定的工程問題。其實該學科誕生的需求便是互聯網上文本信息的爆炸式增長,因此只要能將互聯網上的文本信息處理成我們想要達到的效果就可以啦,不一定非要讓計算機去理解自然語言呀,也不一定非要有嚴謹的語言學規則或者數學公式呀。

三者之間

這樣看來應該有三門獨立的學科才對,然而實際上我們發現國際上、國內的各大頂尖高校幾乎只有“自然語言處理”這一個學科,偶爾會有個研究“計算語言學”的高校,而幾乎沒有研究“自然語言理解”的高校,為什么呢?

?

其實很好理解啦,雖然自然語言理解誕生的最早,但是遺憾的說,這門學科的有效進展幾乎為0,也就是說現在遠遠談不上讓計算機去理解自然語言,依然停留在對自然語言進行處理的層次上。而隨著基于規則的自然語言處理方法的衰落,計算語言學的研究熱潮也大幅度冷卻了。

?

插播一句,總有比較機智的做法,比如美國的CMU(不知道CMU的同學千萬不要說自己是學計算機的!)就沒有自然語言處理,人家起了個新名字叫“人類語言技術”,hhhhh,是不是感覺超機智呀~這樣將來有一天計算機真的可以理解人類語言的時候,其他高校要將專業改名字啦,而CMU就不用改了╮(╯▽╰)╭

?

所以呀,從互相包含的關系上來說,自然語言處理(NLP)、自然語言理解(NLU)、計算語言學(CL)、人類語言技術(HLT)之間的關系是這樣的:

2333,是不是感覺CMU特別心機婊╮(╯▽╰)╭

?

而從研究深度,或者說研究難度上說呢,NLU、CL、NLP這三個具備大量交集的領域是這樣的:

所以呀,現在NLP領域正在蓬勃發展,帶來了機器翻譯(不解釋)、搜索引擎(不解釋)、人機對話(微軟小冰、Siri等)、輿情檢索(比如微博熱搜)、文本情感分析(自動識別好評差評,參見天貓的評價標簽)、信息抽取(如自動生成一篇文章的標題、文摘等,參見今日頭條)、信息過濾(比如過濾小黃文或者反動言論,參加被請去喝茶的童鞋們)、文檔分類(比如你寫一篇足球賽事,計算機可以自動歸類到體育主題,參加各大型新聞網站)、文本自動校正(參見word、搜狗拼音等,不解釋啦)、語音識別、說話人識別、語音轉文本、文本轉語音等一系列技術~

?

所以呀,NLU的大量研究沒有做到人工智能,但NLP卻飛速發展中,通過各種方法實現計算機對自然語言的處理(甚至有時在老百姓看來,計算機好像真的理解了文本一樣)。

?

那么深度學習會不會真正揭開NLU的篇章呢?小夕說啦,不可能哦。想象一下,一個小孩子學會一句話、并成功的將這句話轉換成各種表達方式表達出來,只需要一兩次的重復即可完成。而如今先進的深度學習模型則是消耗海量樣本(意思即對一句話要重復上千上萬次,甚至更多)才能完成勉強可以接受的“智能”水平,但是!一旦測試集稍加改變(比如改變一下問法、換一種表達方式),那么好不容易訓練好的機器學習模型將近乎崩潰!所以也不難理解,哪怕是如今最先進的機器翻譯系統,Google翻譯,有時候在一句話的后面加一個毫無意義的“了”字,卻會產生完全不同的兩種翻譯結果。究其根本原因就是計算機絲毫沒有理解文本。雖然對大眾來說這很難讓人接受,但這是事實。

?

那么計算機何時可以真正去理解文本呢?期待新的機器學習模型吧!

總結

以上是生活随笔為你收集整理的一个问题就可以辨别真假NLP(自然语言处理)研究者的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。