每周论文清单:对话系统综述,全新中文分词框架,视频生成,文字识别
在碎片化閱讀充斥眼球的時代,越來越少的人會去關注每篇論文背后的探索和思考。
在這個欄目里,你會快速 get 每篇精選論文的亮點和痛點,時刻緊跟 AI 前沿成果。
點擊本文底部的「閱讀原文」即刻加入社區,查看更多最新論文推薦。
這是 PaperDaily 的第?33?篇文章[ 自然語言處理 ]
@jueliangguke 推薦
#Convolutional Neural Network
本文提出了一個全新的中文分詞框架,使用深度卷積網絡在多個數據集上達到了 state-of-the-art。
A Survey on Dialogue Systems: Recent Advances and New Frontiers@paperweekly 推薦
#Dialog Systems
本文來自京東數據科學團隊,這是一篇非常全面的對話系統綜述,引用了 100+ 篇相關論文,并對論文進行了分類。
How to Make Context More Useful?
@zhangjianhai 推薦
#ContextQA
在自然語言對話領域,論文首先對比了目前幾種流行的 Context-aware 模型,包括 Non-hierarchical 模型(將 context 與 query 作為一個序列建模)以及 Hierarchical 模型(將 context 與 query 分別建模生成向量表示,在此基礎上采用不同的方式進行整合,包括 sum,concat,sequential integration 等)。
最后,論文提出了一種 Weighted Sequential Integration 的上下文整合方式,對不同的上下文賦予不同的權重。對 ContextQA 相關工作具有一定借鑒意義。
@cfjmonkey 推薦
#Text Style Transfer
該文實現了基于給定屬性的文本風格的轉換。屬性包括標題、作者和類別。不同類別的文章用詞分布不同,同一作者的寫作風格是一致的,標題個人理解可以看做關鍵詞定基調,相比關鍵詞語料更豐富。
實驗在新聞、影評和歌詞三大類文本中進行。 該工作作者來自今日頭條,eBay 和清華。
Globally Normalized Reader@zhangjun 推薦
#Question Answering
來自百度的 QA 系統,本文已被 EMNLP 2017 接收。
Panoptic Segmentation@YiqiYan 推薦
#Semantic Segmentation
本文提出了一種新的概念 — Panoptic Segmentation,它是對 instance sengmentation 和 semantic segmentation 的統一。
例如一副街景:instance sengmentation 只分割出一些實例,但是要區分同一類別的個體(分割出車 a,車 b,車 c);semantic segmentation 是把每一個像素分入一個類別,但是不區分個體;Panoptic Segmentation 既要完成 semantic segmentation 的任務,又要區分同一個類別的不同個體。
Adversarial Patch@Synced 推薦
#Adversarial Training
該論文提出了一種在現實世界中創建通用、魯棒、針對性的對抗圖像 patch 的方法。該 patch 是通用的,因為它們可用于攻擊任何場景;是魯棒的,因為它們在多種圖像變換中都是有效的;是有針對性的,因為它們可以令分類器輸出任意目標類。
這些對抗樣本可以被打印出來,添加到任意的場景、照片,并展示給圖像分類器;即使 patch 很小,也能導致分類器忽略場景中的其它物體,輸出選定的目標類。
@Aidon 推薦
#Video Captioning
文章指出現有的 captioning 模型都是用交叉熵損失(XE: cross-entropy loss)訓練的,而實際評估的時候用的是其他指標比如 BLEU,METEOR 等。
這里對應的是第一個問題:objective mismatch,很自然地會想到可以直接對評價指標進行優化。第二個問題是 exposure bias,即訓練集和測試集上 captions 的分布很有可能是不一樣的。雖然強化學習有被用于解決第一個問題,但它的計算開銷大,并且在每一步都有指定 baseline reward 才能保證模型的收斂。
針對以上問題,文章提出基于一致性的序列訓練來做 video captioning。首先從理論上解釋了 XE training 和 RL training 之間的聯系,即后者是前者的一個加權形式;然后引入一個簡單的 WXE pre-training 來近似 RL training,這樣就解決了前面提到的第一個問題。
更進一步地,文章提出用 full REINFORCE 來進行 fine-tune,利用 gt captions 的 consensus score 作為 baseline reward,這樣就可以避免 XE training 帶來的第二個問題。
@zhangjun 推薦
#Video Generation
本文是 MILA 最近的一篇工作,實現了一個根據 text 合成唇同步視頻的架構,并以奧巴馬做了一個 demo,命名為 ObamaNet。
Demo 地址:http://ritheshkumar.com/obamanet/
Arbitrarily-Oriented Text Recognition@chenhong 推薦
#Text Detection
論文中 2D 圖像的任意方向的字符編碼為 4 個方向的 4 個特征序列表示:左→右,右→左,上→下,下→上(每個方向的特征序列長度相同)。
論文提出一個魯棒性算法,基于 AON 識別規則和不規則自然場景字符。基于 top-down,無需檢測字符,直接預測原始圖像整個字符,end-to-end 實現。
本文由 AI 學術社區 PaperWeekly 精選推薦,社區目前已覆蓋自然語言處理、計算機視覺、人工智能、機器學習、數據挖掘和信息檢索等研究方向,點擊「閱讀原文」即刻加入社區!
我是彩蛋?
?解鎖新功能:熱門職位推薦!
PaperWeekly小程序升級啦
今日arXiv√猜你喜歡√熱門職位√
找全職找實習都不是問題
?
?解鎖方式?
1. 識別下方二維碼打開小程序
2. 用PaperWeekly社區賬號進行登陸
3. 登陸后即可解鎖所有功能
?職位發布?
請添加小助手微信(pwbot01)進行咨詢
?
長按識別二維碼,使用小程序
*點擊閱讀原文即可注冊
關于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
總結
以上是生活随笔為你收集整理的每周论文清单:对话系统综述,全新中文分词框架,视频生成,文字识别的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 今晚直播:GAN在网络特征学习中的应用
- 下一篇: java信息管理系统总结_java实现科