论文浅尝 | 基于动态记忆的原型网络进行元学习以实现少样本事件探测
本文轉載自公眾號:浙大KG。?
論文題目:Meta-Learning with Dynamic-Memory-Based Prototypical Network for Few-Shot Event Detection
本文作者:鄧淑敏,浙江大學在讀博士,研究方向為低資源條件下知識圖譜自動化構建關鍵技術研究
發表會議:WSDM 2020
論文鏈接:https://arxiv.org/abs/1910.11621
FewEvent數據集鏈接: https://github.com/231sm/Low_Resource_KBP
????事件抽取(EE)是一項旨在從非結構化文本中提取結構事件信息的任務,它可以分兩個子任務:事件檢測(event detection)與元素抽取(argument extraction)。事件檢測需要找到事件描述文本中的觸發詞,并將其對應到指定的事件類型,元素抽取需要找到事件的參與元素,并劃分它們在事件中扮演的角色。本文基于目前事件抽取數據集的稀疏問題,以及考慮到現實世界中的新事件層出不窮,重新審視了事件檢測任務。在元學習的設置下,將事件檢測建模成少樣本學習任務(遵循N-Way-K-Shot的實驗設定),稱之為少樣本事件檢測(FSED)。
圖1: 模型架構
本文提出了一個基于動態記憶的原型網絡(DMB-PN),該網絡利用動態記憶網絡(DMN)為事件學習更好的原型,模型架構如上圖所示。傳統的原型網絡簡單地通過平均計算事件描述(event mention)文本的編碼來表示事件原型,這樣的做法只會用一次event mention的編碼。考慮到每個事件的樣本比較少,我們希望盡可能多地利用樣本的信息,因此區別于傳統的原型網絡,DMB-PN整合了DMN,會多次從event mention中提取上下文信息,也就是說DMB-PN會多次使用event mention的編碼,并且進行記憶存儲和更新。我們分別在固定事件類別數N的設置下進行K-Shot的評估,以及在固定每個事件類樣本數K的設置下進行N-Way的評估。實驗表明,DMB-PN不僅比原型網絡處理樣本稀疏性的性能更好,而且在類型數目增多和樣本數目減少的時候性能更加穩定。
此外,動態記憶網絡還用于學習模型中的事件原型和句子編碼。具體來說,我們在典型的DMN模塊中使用觸發詞作為問題來產生存儲向量,從而產生對觸發詞更敏感的句子編碼。由于DMN的多跳機制,使得它更有利于充分利用事件實例,因此基于DMN的模型在句子編碼方面更健壯,特別是在少樣本場景中。
部分實驗結果如下所示:
表1: 5-Way-X-Shot的實驗結果比較
表2: 10-Way-X-Shot的實驗結果比較
圖2:?X-Way-15-Shot的實驗結果比較
總而言之,這篇文章研究工作的主要貢獻是:
(1)正式定義和提出“少樣本事件檢測”的新問題,并生成了一個專門針對該問題名為FewEvent的新數據集;
(2)提出了一個基于動態記憶的原型網絡的新框架DMB-PN,該框架利用動態記憶網絡不僅可以為事件類型學習更好的原型,還可以為事件描述文本生成更健壯的句子編碼;
(3)實驗表明,與記憶機制集成的原型網絡的性能優于一系列的傳統模型,特別是當事件類型的種類相對較多且樣本數量非常少時,這是因為它具有從事件實例中多次提取上下文信息的能力。
如果對本文的工作感興趣,歡迎大家閱讀原文,也歡迎大家和我們交流。
?
?
OpenKG
開放知識圖譜(簡稱 OpenKG)旨在促進中文知識圖譜數據的開放與互聯,促進知識圖譜和語義技術的普及和廣泛應用。
點擊閱讀原文,進入 OpenKG 博客。
總結
以上是生活随笔為你收集整理的论文浅尝 | 基于动态记忆的原型网络进行元学习以实现少样本事件探测的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 论文浅尝 | 基于图注意力的常识对话生成
- 下一篇: 领域应用 | 从数据到智慧,知识图谱如何