日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

《Do Neural Dialog Systems Use the Conversation History Effectively? An Empirical Study》

發(fā)布時(shí)間:2024/8/26 编程问答 46 豆豆
生活随笔 收集整理的這篇文章主要介紹了 《Do Neural Dialog Systems Use the Conversation History Effectively? An Empirical Study》 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

https://zhuanlan.zhihu.com/p/73723782

請(qǐng)復(fù)制粘貼到markdown 查看器查看!

Do Neural Dialog Systems Use the Conversation History Effectively? An Empirical Study

ACL2019

Chinnadhurai Sankar, Sandeep Subramanian, Christopher Pal, Sarath Chandar, [Yoshua Bengio]

https://arxiv.org/abs/1906.01603

abstract

神經(jīng)網(wǎng)絡(luò)生成模型在構(gòu)建對(duì)話 agent 方面越來越流行,這種方法可以靈活的適應(yīng)多個(gè) domain,且需要很少的領(lǐng)域?qū)<腋深A(yù)。這些系統(tǒng)一個(gè)被大家經(jīng)常指出的問題就是他們很少有效的去使用獲得的對(duì)話歷史。這篇文章中,作者使用一種方法去理解模型是怎樣利用對(duì)話歷史的,這個(gè)方法是先是人工給文本引進(jìn) unnatural 改變或者是擾動(dòng),再去觀察模型對(duì)這些改變的敏感度。作者在 4 個(gè)對(duì)論對(duì)話數(shù)據(jù)集上進(jìn)行 10 種不同擾動(dòng)的實(shí)驗(yàn),發(fā)現(xiàn)通常使用的基于 RNN 和 transformer 的 seq2seq 模型對(duì)于大多數(shù)擾動(dòng)都是不敏感的。再者,作者開源了代碼,認(rèn)為這將會(huì)是一個(gè)檢驗(yàn)對(duì)話系統(tǒng)的有用工具。

introduction

人們猜測(cè)是因?yàn)椴荒芎芎玫睦脤?duì)話歷史,所以模型經(jīng)常沒有辦法產(chǎn)生對(duì)話主題相關(guān)的句子,比方說回應(yīng)一些諸如 “謝謝”,“好的” 這些無(wú)關(guān)緊要的話。實(shí)驗(yàn)的一個(gè)核心的前提(思想)是說,如果這個(gè)模型對(duì)認(rèn)為造成的文本內(nèi)容的改變(擾動(dòng))不敏感,那就是說它沒有非常大程度的利用這段內(nèi)容。作者發(fā)現(xiàn):

  • recurrent and transformer-based seq2seq models 對(duì)于實(shí)驗(yàn)中的大多數(shù)種類的擾動(dòng)都不敏感
  • 甚至在 randomly shuffling or reversing words within every utterance in the conversation history 這種極大的變化的情況下,二者都不是特別敏感
  • recurrent model 對(duì)于對(duì)話歷史中每個(gè) utterance 的先后順序很敏感,這意味著他可以比 transformer 更好的模擬對(duì)話動(dòng)態(tài)。

experiment setup

作者將給定對(duì)話歷史生成恰當(dāng)回復(fù)的問題演變?yōu)橐粋€(gè) conditional language modeling problem. 要學(xué)習(xí)一種條件概率分布 $P_\theta (y|x)$ ,其中 $y$ 是給定對(duì)話歷史 $x$ 應(yīng)該出現(xiàn)的合理的回復(fù)。對(duì)話歷史由一系列 utterance $\bold{x_1}, \bold{x_2}, ... \bold{x_n}$ 表示,其中每個(gè) $\bold{x_i}$ 由一系列單詞 $x_{i_1}, x_{i_2}, ...x_{i_k} $ 組成,回復(fù) $y$ (utterance)同理由 $y_{i_1}, y_{i_2}, ...y_{i_k}$ 組成。至此,完整的條件概率表示為:
$$
P_{\theta}(y|x) = \prod^n_{i = 1} P_{\theta}(y_i|y_{<i},\bold{x_1}, \bold{x_2}, ... \bold{x_n})
$$
工作的關(guān)鍵是研究當(dāng)我們?nèi)斯さ母蓴_對(duì)話歷史 $\bold{x_1}, \bold{x_2}, ... \bold{x_n}$ 時(shí),學(xué)到的概率分布會(huì)有怎么樣的行為。作者通過觀察在這些變化下 per-token 的 perplexity (困惑度) 增加了多少來測(cè)量這姓行為。如果增加量很小,那么我們就可以總結(jié)出 $\bold{x_1}, \bold{x_2}, ... \bold{x_n}$ 的順序?qū)τ谀P筒皇呛苤匾K械哪P陀?xùn)練的時(shí)候都不加入擾動(dòng),敏感度只在測(cè)試的時(shí)候被測(cè)試。

1. datasets

四個(gè)多輪對(duì)話數(shù)據(jù)集

  • bAbI dialog : 任務(wù)導(dǎo)向多輪數(shù)據(jù)集,五個(gè)預(yù)定飯店的任務(wù),復(fù)雜度依次增加。實(shí)驗(yàn)使用任務(wù)5,因?yàn)檫@個(gè)是最難的,它包括 1000 個(gè)對(duì)話,每個(gè)對(duì)話平均有 13 個(gè) user utterance。
  • Persona Chat : 開放域?qū)υ挃?shù)據(jù)集,兩個(gè)人被隨機(jī)安排兩個(gè)角色進(jìn)行對(duì)話產(chǎn)生。10.9$k$ 個(gè)對(duì)話,平均每個(gè)對(duì)話 14.8 輪。
  • Dailydialog : 收集每天日常的對(duì)話,涉及多個(gè)主題。13$k$ dialogs / 7.9 turns
  • MutualFriends : 多輪 goal-oriented,兩個(gè)agents 必須去發(fā)現(xiàn)他們的朋友中誰(shuí)是二者共有的。11$k$ / 11.41 utterances。
2. types of perturbations

每種擾動(dòng)都獨(dú)立的執(zhí)行

  • utterance-level perturbations : 1) $ \mathcal{Shuf}$ : 隨機(jī)打亂對(duì)話歷史中的 utterances。2) $\mathcal{Rev}$ : 每個(gè) utterance 保持不變,但對(duì)話歷史對(duì)話順序顛倒。3) $\mathcal{Drop}$ : 完全丟掉某個(gè) utterance。4) $\mathcal{Truncate}$ 縮減對(duì)話歷史,只留下最近的 k 個(gè)utterances。
  • word-level perturbations : 1) $\mathcal{word-shuffle}$ 2) $\mathcal{reverse}$ 3) $\mathcal{word-drop}$ : 丟掉 30% 的 words 4) $\mathcal{noun-drop}$ : 丟掉所有的名詞。5) $\mathcal{verb-drop}$
3. models

所有的數(shù)據(jù)加載,模型實(shí)現(xiàn),和評(píng)估的過程都在 ParlAI 架構(gòu)實(shí)現(xiàn)的。模型的所有超參數(shù)也都是和那個(gè)平臺(tái)一樣。

  • recurrent models : seq2seq_LSTM
  • transformer : 300 維 embeddings and hidden states

實(shí)驗(yàn)中的模型可能不是試驗(yàn)中所用的數(shù)據(jù)集上表現(xiàn)最優(yōu)的模型,作者仍然相信這些模型至少可以像一個(gè)baseline 一樣具有普適性普遍的使用。在這篇文章中,作者訓(xùn)練10輪就停止為了去保存最好的模型(?)。

results & discussion

表 2 第二列展示了在測(cè)試集上不同模型的困惑度,后邊幾列是不同的擾動(dòng)造成的困惑度的 increase;圖一展示了僅僅摘取最近 k 句話作為對(duì)話歷史時(shí)模型困惑度的改變。

作者有如下發(fā)現(xiàn):

  • 在大多數(shù)情況下模型在困惑度上只有很小的改變,甚至當(dāng)改變非常明顯時(shí)也變化不大,這意味著模型使用的信息只是提供給他們的信息中很少一部分。
  • transformer 對(duì)詞序的變化不敏感,這意味著他們能學(xué)習(xí)詞袋表示
  • 注意力機(jī)制的使用使得模型使用更多的來自于對(duì)話早期的信息(當(dāng)只使用一句話時(shí)困惑度增加的非常劇烈)
  • 盡管 transformer 模型收斂更快且有著更低的困惑度,但是他們似乎不能捕捉到對(duì)話歷史中的動(dòng)態(tài)變化且對(duì)擾動(dòng)不是很敏感,相對(duì)于recurrent 模型來說。

conclusion

本文研究生成神經(jīng)對(duì)話系統(tǒng)在其所依賴的對(duì)話歷史中綜合引入擾動(dòng)時(shí)的行為。我們發(fā)現(xiàn),即使對(duì)對(duì)話歷史進(jìn)行劇烈的、非自然的修改,recurrent and transformer-based seq2seq models 也沒有顯著的變化。我們還發(fā)現(xiàn)了 recurrent and transformer-based seq2seq models 在利用對(duì)話歷史的方式上的細(xì)微區(qū)別。通過開源代碼,我們相信這種通過引入擾動(dòng)來研究模型行為的例子將成為一個(gè)有用的診斷工具。

轉(zhuǎn)載于:https://www.cnblogs.com/forPrometheus-jun/p/11177804.html

總結(jié)

以上是生活随笔為你收集整理的《Do Neural Dialog Systems Use the Conversation History Effectively? An Empirical Study》的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 欧美成人福利视频 | 国产日韩欧美一区二区东京热 | 亚洲福利影院 | 日本高潮网站 | 天堂中文在线视频 | 亚洲国产视频一区二区三区 | 国产一区二区三区麻豆 | 国产小视频你懂的 | 亚洲国产精品久久久久婷婷老年 | 少妇久久久久久久 | 能免费看18视频网站 | 大片视频免费观看视频 | 精品视频第一页 | 99久久久精品免费观看国产 | 国产精品视频一区二区三区不卡 | 秋霞成人午夜鲁丝一区二区三区 | 与亲女洗澡时伦了毛片 | 亚洲激情社区 | 亚洲女优在线播放 | 亚洲av色一区二区三区精品 | 免费日批视频 | 黄色一机片 | 久久亚洲综合色 | 水果视频污 | 99精品久久久久久久婷婷 | 色狠狠干| www.日日夜夜 | 国产一二三精品 | 成片免费观看 | 一边摸上面一边摸下面 | 91精品视频免费 | 国产高清在线 | 亚洲另类自拍 | 伊人99热 | 成人xxx | 熟妇无码乱子成人精品 | 黑人精品xxx一区一二区 | a天堂视频在线观看 | 天堂视频在线免费观看 | 成人在线观看免费视频 | 日韩伊人网 | 91在线无精精品入口 | 久热这里只有精品在线 | 久操视频在线 | 欧美有码视频 | 日韩av电影在线播放 | 成人午夜淫片免费观看 | 我和公激情中文字幕 | www.亚洲一区二区三区 | 中文无码精品一区二区三区 | 人人妻人人澡人人爽人人精品 | 66亚洲一卡2卡新区成片发布 | 韩国女主播裸体摇奶 | 久久99久久99精品免视看婷婷 | 成人av一区二区三区在线观看 | 在线爱情大片免费观看大全 | 精品人伦一区二区三区蜜桃免费 | 亚洲超碰av | 久久久久亚洲av成人无码电影 | 激情插插| 久久精品一区 | 日本精品视频一区二区 | 草草影院发布页 | 欧美国产乱视频 | 边吃奶边添下面好爽 | 成人精品久久久午夜福利 | 动漫大乳美女 | 亚洲欧美日本韩国 | 老汉色老汉首页av亚洲 | 三级a做爰全过程 | 户外少妇对白啪啪野战 | 小sao货cao死你 | 婷婷av在线 | 成人精品影院 | 综合精品在线 | 日日噜噜夜夜狠狠久久丁香五月 | 成人午夜网站 | 欧美日韩综合 | 国产精品久久综合青草亚洲AV | 中字幕一区二区三区乱码 | 欧美 日韩 国产 在线观看 | 韩国伦理片在线播放 | 久久国产欧美日韩精品 | 日韩综合在线视频 | 国产一卡在线 | 日韩高清免费av | 欧美成人xxx | 亚洲乱码国产乱码精品精的特点 | 毛片久久久久久久 | 久久人妻少妇嫩草av无码专区 | 亚洲乱码国产乱码精品精剪 | 久久一区精品 | 亚洲黄色在线观看视频 | 亚洲视频免费在线观看 | 黄色片免费在线 | 欧美丰满熟妇bbbbbb百度 | 亚洲一区二区高清 | 91国产大片| 亚洲综合在线第一页 |