生活随笔
收集整理的這篇文章主要介紹了
简单的中文分词系统httpcws
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
?
HTTPCWS 是一款基于HTTP協(xié)議的開(kāi)源中文分詞系統(tǒng),目前僅支持Linux系統(tǒng)。HTTPCWS 使用“ICTCLAS 3.0 2009共享版中文分詞算法”的API進(jìn)行分詞處理,得出分詞結(jié)果。
????1 安裝.???
wget http://httpcws.googlecode.com/files/httpcws-1.0.0-x86_64-bin.tar.gz
tar zxvf httpcws-1.0.0-x86_64-bin.tar.gz
rm?-f httpcws-1.0.0-x86_64-bin.tar.gz
cd httpcws-1.0.0-x86_64-bin/2 啟動(dòng)下載解包后,會(huì)發(fā)現(xiàn)里面有一個(gè)可執(zhí)行文件,也就是說(shuō)不用編譯,比較省事。啟動(dòng)命令:
/usr/local/httpcws-1.0.0-x86_64-bin/httpcws?-d?-x?/usr/local/httpcws-1.0.0-x86_64-bin/dict/可以使用/usr/local/httpcws-1.0.0-x86_64-bin/httpcws -h 查看啟動(dòng)參數(shù):
3 程序調(diào)用.httpcws支持所有可以發(fā)出HTTP請(qǐng)求的語(yǔ)言,因?yàn)樗且訦TTP協(xié)議調(diào)用的,在瀏覽器輸入http://127.0.0.1:1985/?w=分詞系統(tǒng)測(cè)試,便可以得到分詞的結(jié)果了。所以只要可以發(fā)送HTTP請(qǐng)求的語(yǔ)言,都可以調(diào)用它。4?分詞速度局域網(wǎng)內(nèi) HTTPCWS 接口中文分詞平均處理速度(Wait時(shí)間):0.001秒。HTTPCWS 基于 libevent + epoll 網(wǎng)絡(luò)IO模型開(kāi)發(fā),經(jīng)測(cè)試,每秒可處理5000~20000次請(qǐng)求。
5、自定義詞庫(kù)修改dict/httpcws_dict.txt文件,可以自由增加自己需要的詞語(yǔ)。重啟httpcws即可生效。
總結(jié)
以上是生活随笔為你收集整理的简单的中文分词系统httpcws的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。