统计机器翻译中的几篇经典文献
統計機器翻譯中的幾篇經典文獻
MIT人工智能實驗室的《如何做研究》建議閱讀本領域中最本質的幾篇論文:“如果你對AI的某個子領域感興趣,向該領域的高年級研究生請教本領域最重要的十篇論文是什么”。閱讀經典論文,對于了解感興趣的領域非常重要。而關于統計機器翻譯,最經典的幾篇論文又是什么呢?以下是我根據自己的經驗總結的幾篇經典論文,如有遺漏,歡迎補充。
1.A?Statistical?Approach?to?Machine?Translation
簡稱Brown90,這是統計機器翻譯的奠基之作,是了解統計機器翻譯基本思想的必讀,文章中最主要的思想是把機器翻譯看成是一個信息傳輸的過程,用一種信源信道模型對機器翻譯進行解釋。另外文章主要是對統計機器翻譯三部分(翻譯模型、語言模型及解碼)的宏觀介紹,涉及的數學理論并沒有過多的詳細解釋,因此讀來比較輕松。
2.?The?Mathematics?of?Machine?Translation:?Parameter?Estimation
簡稱Brown93,主要針對Brown90中翻譯模型的參數估計進行了詳細的數學解釋,需要一定的數學基礎和耐心,不過Kevin?Knight?99年JHU(約翰霍普金斯大學)夏季機器翻譯研討班上的《A?Statistical?MT?Tutorial?Workbook》對Brown93用例子及通俗的方式進行了講解,讀來比較容易理解,值得對照閱讀。
3.?Discriminative?Training?and?Maximum?Entropy?Models?for?Statistical?Machine?Translation
這是統計機器翻譯領域中傳奇人物Franz?Josef?Och?在2002年ACL會議上發表的論文,他提出了基于最大熵模型的統計機器翻譯方法,是對Brown信源信道模型的極大擴展,開闊了統計機器翻譯的視野,并為研究者提供了一個融合其它知識到統計機器翻譯中的研究框架,這篇論文獲得了當年的ACL最佳論文獎。
4.?Statistical?Phrase-Based?Translation
這是統計機器翻譯領域另一個大牛Philipp?Koehn?2003年與Och合著的文章,已涉及了具體的方法而不是理論框架:基于短語的統計機器翻譯。之所以選在這里,與Koehn?2004年發布的具有廣泛影響力的解碼器Pharaoh不無關系,Pharoah現在已被Koehn領導的另一個開源項目Moses所取代。
5.?BLEU:?A?Method?for?Automatic?Evaluation?of?Machine?Translation
這是目前用得最廣的機器翻譯自動評測方法BLEU的原始論文,之所以選在這里,因為評測方法的好壞對于機器翻譯的研究具有很大的影響,BLEU理應作為評測方法的代表入選。
?
總結
以上是生活随笔為你收集整理的统计机器翻译中的几篇经典文献的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Flash游戏破解
- 下一篇: 计算机维护工具盘,HB520WZ计算机维