日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【每周NLP论文推荐】 介绍语义匹配中的经典文章

發(fā)布時間:2025/3/20 编程问答 20 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【每周NLP论文推荐】 介绍语义匹配中的经典文章 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

歡迎來到《每周NLP論文推薦》。在這個專欄里,還是本著有三AI一貫的原則,專注于讓大家能夠系統(tǒng)性完成學習,所以我們推薦的文章也必定是同一主題的。

語義匹配也是NLP中比較基礎的任務,它的主要目標是計算兩個querry、兩個文本之間的關系,包括相似度、問答關系等。在搜索引擎、智能問答、知識檢索、信息流推薦等系統(tǒng)中都有應用。

作者&編輯 | 小Dream哥

1 最早的深度語義匹配模型-DSSM

Deep Structured Semantic Models(DSMM)的原理很簡單,通過搜索引擎里 Query 和 Title 的海量的點擊曝光日志,用 DNN 把 Query 和 Title 表達為低維語義向量,并通過 cosine 距離來計算兩個語義向量的距離,最終訓練出語義相似度模型。該模型既可以用來預測兩個句子的語義相似度,又可以獲得某句子的低維語義向量表達。

DSSM采用詞袋模型(BOW),因此喪失了語序信息和上下文信息。另一方面,DSSM 采用弱監(jiān)督、端到端的模型,預測結果不可控。

文章引用量:300+

推薦指數:?????

[1] Huang P S , He X , Gao J , et al. Learning deep structured semantic models for web search using clickthrough data[C]// Proceedings of the 22nd ACM international conference on Conference on information & knowledge management. ACM, 2013.

2 卷積用在語義匹配上-CLSM

針對DSSM詞袋模型丟失上下文信息的缺點,CLSM(convolutional latent semantic model)應運而生,又叫 CNN-DSSM。CNN-DSSM 與 DSSM 的區(qū)別主要在于輸入層和表示層。


文章引用量:140+

推薦指數:?????

[2] Shen Y , He X , Gao J , et al. [ACM Press the 23rd ACM International Conference - Shanghai, China (2014.11.03-2014.11.07)] Proceedings of the 23rd ACM International Conference on Conference on Information and Knowledge Management - CIKM \"14 - A Latent Semantic Model with Convolutional-Pooling Structure for Information Retrieval[J]. 2014:101-110.

3 LSTM用在語義匹配上

針對 CNN-DSSM無法捕獲較遠距離上下文特征的缺點,有人提出了用LSTM-DSSM來解決該問題。

文章引用量:較少

推薦指數:?????

[3] Palangi H , Deng L , Shen Y , et al. Semantic Modelling with Long-Short-Term Memory for Information Retrieval[J]. Computer Science, 2014.

4 MV-DSSM

MV learning是指從不共享特征空間的多個domain中學習模型。MVDNN可以通過滲透多domain的數據來學習到更好的用戶表征。

基于Multi-View的DSSM參數變多了,由于多視角的訓練,輸入的語料也可以變得不同,自由度也更大了,但是隨之帶來的問題就是訓練會變得越來越困難。

文章引用量:較少

推薦指數:?????

[4]?Elkahky A M , Song Y , He X . A Multi-View Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems[C]// the 24th International Conference. International World Wide Web Conferences Steering Committee, 2015.

5 基于字符特征的語義匹配?

研究了基于字符和字符特征與基于詞向量進行語義匹配任務的差異,觀點挺新穎,可以一看。

文章引用量:較少

推薦指數:?????

[5] Wuwei Lan, Wei Xu. Character-based Neural Networks for Sentence Pair Modeling. arXiv preprint arXiv:1805.08297v1, 2018.

6 基于BERT的語義相似度計算與匹配

基于BERT及其他預訓練模型進行語義相似度計算是一種趨勢,這篇文章只是做了一個簡要的介紹,實在找不到更好的文章了。有的同學請推薦呀。


文章引用量:較少

推薦指數:?????

[6] Manish Patel. TinySearch- Semantics based Search Engine using Bert Embeddings. 2019.

7 ResNet寬度問題?

一篇綜述性的文章,介紹了多種用于語義計算的深度學習模型,并進行了比較,值得一讀。

文章引用量:較少

推薦指數:?????

[7]?Zagoruyko S, Komodakis N. Neural Network Models for Paraphrase Identifification, Semantic Textual Similarity, Natural Language Inference, and Question Answering. arXiv:1806.04330v2, 2019.

8 非常好的工具MatchZOO

語義匹配非常好的開源工具,這篇文章介紹了如何利用這個工具進行訓練,快速獲得一個效果較好的模型。


文章引用量:較少

推薦指數:?????

[8]?Jiafeng Guo, Yixing Fan, Xiang Ji, et al. MatchZoo: A Learning, Practicing, and Developing System for Neural Text Matching. arXiv:1905.10289v2.

9 如何獲取文章與交流

找到有三AI開源項目即可獲取。

https://github.com/longpeng2008/yousan.ai

文章細節(jié)眾多,閱讀交流在有三AI-NLP知識星球中進行,感興趣可以加入。

總結

以上就是NLP中語義匹配任務一些比較代表性的文章,下一期我們將介紹一些對話系統(tǒng)的文章。

有三AI夏季劃

有三AI夏季劃進行中,歡迎了解并加入,系統(tǒng)性成長為中級CV算法工程師。

轉載文章請后臺聯(lián)系

侵權必究

往期精選

  • 【NLP】自然語言處理專欄上線,帶你一步一步走進“人工智能技術皇冠上的明珠”。

  • 【NLP】用于語音識別、分詞的隱馬爾科夫模型HMM

  • 【NLP】用于序列標注問題的條件隨機場(Conditional Random Field, CRF)

  • 【NLP】經典分類模型樸素貝葉斯解讀

  • 【NLP】 NLP專欄欄主自述,說不出口的話就交給AI說吧

  • 【NLP】 深度學習NLP開篇-循環(huán)神經網絡(RNN)

  • 【NLP】 NLP中應用最廣泛的特征抽取模型-LSTM

  • 【NLP】 聊聊NLP中的attention機制

  • 【NLP】 理解NLP中網紅特征抽取器Tranformer

  • 【每周NLP論文推薦】從預訓練模型掌握NLP的基本發(fā)展脈絡

  • 【技術綜述】深度學習在自然語言處理中的應用

總結

以上是生活随笔為你收集整理的【每周NLP论文推荐】 介绍语义匹配中的经典文章的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。