java代码翻译器网页版_制作一个Java即时翻译器——网页抓取调用百度翻译API
1.引言
平時(shí)在上網(wǎng)瀏覽網(wǎng)站或者閱讀一些英文文獻(xiàn)的時(shí)候,遇到不明白意思的單詞導(dǎo)致整句話不太理解時(shí)總得打開(kāi)百度。
然后搜索意思,頻繁地打開(kāi)翻譯頁(yè)面讓整個(gè)過(guò)程顯得很繁瑣,或者分屏操作一邊放文獻(xiàn)一邊放翻譯的時(shí)候,文章或網(wǎng)站會(huì)被壓縮,排版會(huì)有變化。
兩種方法都不夠合適,所以我就想做一款即時(shí)翻譯的軟件,需要達(dá)到的功能有:
常駐在屏幕最頂層,通過(guò)監(jiān)聽(tīng)剪切板來(lái)獲取復(fù)制的單詞或長(zhǎng)句,然后在軟件頁(yè)面自動(dòng)進(jìn)行翻譯。同時(shí)有一些附加功能:支持中文與多門外語(yǔ)互譯、監(jiān)聽(tīng)剪切板或者根據(jù)自己輸入的內(nèi)容翻譯等。
加入記錄單詞功能,查詢后可以添加單詞,并提供復(fù)習(xí)回顧的頁(yè)面。
2.具體實(shí)現(xiàn)思路
使用Transferable變量通過(guò)getSystemClipboard()函數(shù)來(lái)獲取剪切板的內(nèi)容getContent(),返回剪切板所得到的數(shù)據(jù)getTransferData()。
獲取翻譯的內(nèi)容:
第一種方式:到網(wǎng)頁(yè)源代碼里進(jìn)行截取和回傳。在百度首頁(yè)查找“translate”單詞,然后打開(kāi)開(kāi)發(fā)人員工具搜索“翻譯”“轉(zhuǎn)變”等幾個(gè)意思,最后在標(biāo)記里面發(fā)現(xiàn)網(wǎng)頁(yè)顯示的翻譯都存在于這個(gè)標(biāo)記里面。連續(xù)嘗試了幾個(gè)單詞后發(fā)現(xiàn)都是在標(biāo)簽里,那么就可以確定這種方法的思路了。
首先明確是要去 http://www.baidu.com/s?wd= 這個(gè)網(wǎng)站找尋標(biāo)簽,那么就分別定義三個(gè)變量來(lái)代表網(wǎng)站、標(biāo)簽頭和標(biāo)簽尾。然后定義一個(gè)HttpURLConnection對(duì)象來(lái)建立起連接,通過(guò)BufferedReader將獲得的輸入流數(shù)據(jù)進(jìn)行整理,獲取翻譯內(nèi)容放入字符串變量,作為函數(shù)的返回值來(lái)調(diào)用。
第二種方式:使用百度翻譯API。首先要去百度翻譯http://api.fanyi.baidu.com 進(jìn)行開(kāi)發(fā)者申請(qǐng),申請(qǐng)通過(guò)后會(huì)獲得一個(gè)APP_ID和SECURITY_KEY,這是相當(dāng)于后面要調(diào)用API的賬號(hào)密碼。然后下載網(wǎng)站底部的Java Demo,提取出HttpGet.java、MD5.java、TransApi.java三個(gè)文件,放入新建的一個(gè)package中。上述三個(gè)是百度官方寫(xiě)的調(diào)用API的方法。
HttpGet.java是建立起http連接的一個(gè)類,將輸入的字符串進(jìn)行URL編碼,轉(zhuǎn)換為%20形式,并且讀取服務(wù)器的數(shù)據(jù),進(jìn)行翻譯內(nèi)容的獲取。
MD5.java是百度官方為了調(diào)用的安全,使用該算法來(lái)生成一段字符串,該java文件負(fù)責(zé)生成該字符串。
TransApi.java用來(lái)發(fā)送所需要的總共六個(gè)字段。
接下來(lái)是具體將獲取的文本添加到TextArea中。首先創(chuàng)建一個(gè)新線程來(lái)隨時(shí)監(jiān)聽(tīng)剪切板的文本,然后監(jiān)聽(tīng)文本框使用addDocumentListener()來(lái)進(jìn)行insertUpdate()操作。
然后是數(shù)據(jù)庫(kù)文件的建立。在MySQL中新建一個(gè)數(shù)據(jù)庫(kù),新建一個(gè)word表,將頁(yè)面記錄的單詞存入該表中,然后通過(guò)JTable和DefaultTableModel將記錄的單詞展示出來(lái)。
3.兩種方式的對(duì)比
通過(guò)獲取網(wǎng)頁(yè)源代碼的方式的優(yōu)點(diǎn)是完全免費(fèi),無(wú)任何次數(shù)限制。缺點(diǎn)是目前只能提供單個(gè)單詞的翻譯,長(zhǎng)句中單詞與單詞間的空格在URL中無(wú)法識(shí)別;同時(shí)僅限于英語(yǔ)翻譯中文。
通過(guò)百度翻譯API。優(yōu)點(diǎn)是可以進(jìn)行單詞、長(zhǎng)句的翻譯,支持中文譯成多種外語(yǔ),也支持多種外語(yǔ)譯成中文。缺點(diǎn)是百度規(guī)定一個(gè)月只給200萬(wàn)字符的免費(fèi)額度,超出的部分按100萬(wàn)字符/49元收費(fèi)。
4.源代碼
InstantTranslator
參考資料:用Java做一個(gè)及時(shí)翻譯工具
總結(jié)
以上是生活随笔為你收集整理的java代码翻译器网页版_制作一个Java即时翻译器——网页抓取调用百度翻译API的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 【机器学习】网格搜索、随机搜索和贝叶斯搜
- 下一篇: java美元兑换,(Java实现) 美元