當前位置：首頁 > 运维知识 > windows >内容正文

windows

每周论文清单：对话系统综述，全新中文分词框架，视频生成，文字识别

發布時間：2024/10/8 windows 31 豆豆

生活随笔收集整理的這篇文章主要介紹了每周论文清单：对话系统综述，全新中文分词框架，视频生成，文字识别小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

在碎片化閱讀充斥眼球的時代，越來越少的人會去關注每篇論文背后的探索和思考。

在這個欄目里，你會快速 get 每篇精選論文的亮點和痛點，時刻緊跟 AI 前沿成果。

點擊本文底部的「閱讀原文」即刻加入社區，查看更多最新論文推薦。

這是 PaperDaily 的第?33?篇文章

[ 自然語言處理 ]

A Gap-Based Framework for Chinese Word Segmentation via Very Deep Convolutional Networks

@jueliangguke 推薦

#Convolutional Neural Network

本文提出了一個全新的中文分詞框架，使用深度卷積網絡在多個數據集上達到了 state-of-the-art。

論文鏈接

https://www.paperweekly.site/papers/1473

A Survey on Dialogue Systems: Recent Advances and New Frontiers

@paperweekly 推薦

#Dialog Systems

本文來自京東數據科學團隊，這是一篇非常全面的對話系統綜述，引用了 100+ 篇相關論文，并對論文進行了分類。

論文鏈接

https://www.paperweekly.site/papers/1446

How to Make Context More Useful?

@zhangjianhai 推薦

#ContextQA

在自然語言對話領域，論文首先對比了目前幾種流行的 Context-aware 模型，包括 Non-hierarchical 模型（將 context 與 query 作為一個序列建模）以及 Hierarchical 模型（將 context 與 query 分別建模生成向量表示，在此基礎上采用不同的方式進行整合，包括 sum，concat，sequential integration 等）。

最后，論文提出了一種 Weighted Sequential Integration 的上下文整合方式，對不同的上下文賦予不同的權重。對 ContextQA 相關工作具有一定借鑒意義。

論文鏈接

https://www.paperweekly.site/papers/1476

SAM: Semantic Attribute Modulation for Language Modeling and Style Variation

@cfjmonkey 推薦

#Text Style Transfer

該文實現了基于給定屬性的文本風格的轉換。屬性包括標題、作者和類別。不同類別的文章用詞分布不同，同一作者的寫作風格是一致的，標題個人理解可以看做關鍵詞定基調，相比關鍵詞語料更豐富。

實驗在新聞、影評和歌詞三大類文本中進行。該工作作者來自今日頭條，eBay 和清華。

論文鏈接

https://www.paperweekly.site/papers/1461

Globally Normalized Reader

@zhangjun 推薦

#Question Answering

來自百度的 QA 系統，本文已被 EMNLP 2017 接收。

論文鏈接

https://www.paperweekly.site/papers/1463

[ 計算機視覺 ]

Panoptic Segmentation

@YiqiYan 推薦

#Semantic Segmentation

本文提出了一種新的概念 — Panoptic Segmentation，它是對 instance sengmentation 和 semantic segmentation 的統一。

例如一副街景：instance sengmentation 只分割出一些實例，但是要區分同一類別的個體（分割出車 a，車 b，車 c）；semantic segmentation 是把每一個像素分入一個類別，但是不區分個體；Panoptic Segmentation 既要完成 semantic segmentation 的任務，又要區分同一個類別的不同個體。

論文鏈接

https://www.paperweekly.site/papers/1479

Adversarial Patch

@Synced 推薦

#Adversarial Training

該論文提出了一種在現實世界中創建通用、魯棒、針對性的對抗圖像 patch 的方法。該 patch 是通用的，因為它們可用于攻擊任何場景；是魯棒的，因為它們在多種圖像變換中都是有效的；是有針對性的，因為它們可以令分類器輸出任意目標類。

這些對抗樣本可以被打印出來，添加到任意的場景、照片，并展示給圖像分類器；即使 patch 很小，也能導致分類器忽略場景中的其它物體，輸出選定的目標類。

論文鏈接

https://www.paperweekly.site/papers/1475

Consensus-based Sequence Training for Video Captioning

@Aidon 推薦

#Video Captioning

文章指出現有的 captioning 模型都是用交叉熵損失（XE: cross-entropy loss）訓練的，而實際評估的時候用的是其他指標比如 BLEU，METEOR 等。

這里對應的是第一個問題：objective mismatch，很自然地會想到可以直接對評價指標進行優化。第二個問題是 exposure bias，即訓練集和測試集上 captions 的分布很有可能是不一樣的。雖然強化學習有被用于解決第一個問題，但它的計算開銷大，并且在每一步都有指定 baseline reward 才能保證模型的收斂。

針對以上問題，文章提出基于一致性的序列訓練來做 video captioning。首先從理論上解釋了 XE training 和 RL training 之間的聯系，即后者是前者的一個加權形式；然后引入一個簡單的 WXE pre-training 來近似 RL training，這樣就解決了前面提到的第一個問題。

更進一步地，文章提出用 full REINFORCE 來進行 fine-tune，利用 gt captions 的 consensus score 作為 baseline reward，這樣就可以避免 XE training 帶來的第二個問題。

論文鏈接

https://www.paperweekly.site/papers/1450

ObamaNet: Photo-realistic Lip-sync from Text

@zhangjun 推薦

#Video Generation

本文是 MILA 最近的一篇工作，實現了一個根據 text 合成唇同步視頻的架構，并以奧巴馬做了一個 demo，命名為 ObamaNet。

Demo 地址：http://ritheshkumar.com/obamanet/

論文鏈接

https://www.paperweekly.site/papers/1505

Arbitrarily-Oriented Text Recognition

@chenhong 推薦

#Text Detection

論文中 2D 圖像的任意方向的字符編碼為 4 個方向的 4 個特征序列表示：左→右，右→左，上→下，下→上（每個方向的特征序列長度相同）。

論文提出一個魯棒性算法，基于 AON 識別規則和不規則自然場景字符。基于 top-down，無需檢測字符，直接預測原始圖像整個字符，end-to-end 實現。

論文鏈接

https://www.paperweekly.site/papers/1488

本文由 AI 學術社區 PaperWeekly 精選推薦，社區目前已覆蓋自然語言處理、計算機視覺、人工智能、機器學習、數據挖掘和信息檢索等研究方向，點擊「閱讀原文」即刻加入社區！

我是彩蛋?

?解鎖新功能：熱門職位推薦！

PaperWeekly小程序升級啦

今日arXiv√猜你喜歡√熱門職位√

找全職找實習都不是問題

?解鎖方式?

1. 識別下方二維碼打開小程序

2. 用PaperWeekly社區賬號進行登陸

3. 登陸后即可解鎖所有功能

?職位發布?

請添加小助手微信（pwbot01）進行咨詢

長按識別二維碼，使用小程序

*點擊閱讀原文即可注冊

關于PaperWeekly

PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域，歡迎在公眾號后臺點擊「交流群」，小助手將把你帶入 PaperWeekly 的交流群里。

總結

以上是生活随笔為你收集整理的每周论文清单：对话系统综述，全新中文分词框架，视频生成，文字识别的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：今晚直播：GAN在网络特征学习中的应用
下一篇： java信息管理系统总结_java实现科