谷歌采用神经网络驱动机器翻译,可离线翻译59种语言
?
內容來源:ATYUN AI平臺
谷歌的在線翻譯自2016年以來一直由神經機器翻譯(NMT)驅動,今天,該公司推出了其神經網絡驅動的方法,以便谷歌翻譯的iOS和安卓應用用戶能夠更準確地實現59種語言的離線翻譯。
谷歌產品經理Julie Cattiau表示,谷歌翻譯小組與谷歌大腦團隊一起使用TensorFlow完成了離線NMT。與其他谷歌應用不同,95%的谷歌翻譯用戶群不在美國境內,而在印度,巴西和印度尼西亞等國家。“所以我們從用戶那里得到很多高質量的在線信息,但是他們中的很多人無法訪問互聯網連接,或者他們更愿意保存他們的數據計劃。所以我們在過去的一年半時間里把它作為一項重點,將我們的NMT模型搭入人們的設備。”
與以前的機器學習方法通過掃描句子短語提供解釋相比,NMT的離線翻譯可以一次分析整個文本塊,從而允許更自然、更和條理的聲音,以及情境感知翻譯。
連接到互聯網時,谷歌翻譯應用程序中的對話模式可以提供現場語音翻譯。但是,NMT離線翻譯是以純文本翻譯的形式發布,它不會擴展到翻譯應用程序中的功能,比如解釋拍攝的菜單或翻譯聲音。
為了使實時的語音翻譯成為可能,谷歌必須使AI的其他元素結合起來,才能在離線狀態下使用對話模式,比如語音識別以及將文字從文本合成到語音。
“這些部件中都需要在設備上進行構建,才能獲得完整的體驗,這絕對是我們想要推出的東西,”她說。“目前還沒有確定日期,但文本翻譯無疑是構建語音端到端離線翻譯的基石之一。”
獲得離線神經機器翻譯不需要更新程序。之前下載了離線翻譯軟件包的用戶將看到一條橫幅,點擊橫幅就可以離線翻譯,而新用戶必須先進入該應用并選擇他們想要離線使用的語言進行下載。每種語言包大約需要35-45 MB,大小與之前的離線包相當,但質量更高。
?
Cattiau說,“我們無法在低端手機上運行這些耗費大量計算能力的模型,因此需要工程師壓縮模型并使其在非常低端的安卓設備上運行。這也是這次發布的挑戰。”
用戶應該注意到這與之前的離線翻譯有所不同,但在線翻譯仍然比離線翻譯更準確,因為減少了語言包的空間。
與以前使用的基于短語的機器學習方法一樣,NMT利用了數以億計的文章,書籍,文檔和搜索結果等示例翻譯。
谷歌的語言能力不僅僅改進了翻譯應用程序。Alphabet的子公司已承諾在今年年底前為谷歌智能助理提供30多種語言,這個數字遠遠超過支持4種語言的Alexa的和支持20種語言的Siri。
本文轉自ATYUN人工智能媒體平臺,原文鏈接:谷歌采用神經網絡驅動機器翻譯,可離線翻譯59種語言
更多推薦
你現在可以通過Alexa控制其它設備
VMware和Nvidia推出用于機器學習的混合云
議員?罪犯?傻傻分不清楚
標簽:
智能設備自然語言處理NLP谷歌
歡迎關注ATYUN官方公眾號
商務合作及內容投稿請聯系郵箱:bd@atyun.com
總結
以上是生活随笔為你收集整理的谷歌采用神经网络驱动机器翻译,可离线翻译59种语言的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 手撕神经网络(1)——神经网络的基本组件
- 下一篇: iOS ScrollView的使用教程