迅搜自定义分词
用xunsearch做了個小搜索引擎,今天錄入一個一句話,有個詞沒分出來,可能是默認(rèn)詞庫里沒有,于是想自己自定義詞庫,去官網(wǎng)看看,有教程,這里就記錄一下過程吧,迅搜在自定義詞庫上搞的還是挺方便的,我只有幾千條數(shù)據(jù),反正就是玩玩嘛!
我的迅搜安裝目錄:/usr/local/xunsearch
下面記錄步驟:
1.進(jìn)入詞庫目錄,使用vi打開自定義詞庫文件
cd/usr/local/xunsearch/etc/
vidict_user.txt
2.文件中有說明,直接輸入你要添加的詞就行
TF和IDF值可以使用下面工具計算:http://www.xunsearch.com/scws/demo/get_tfidf.php
詞性(ATTR)可參考如下表:http://unun.in/sql/145.html
下面上個例子:
3.保存退出,重啟一下xs-searchd
/usr/local/xunsearch/bin/xs-ctl.sh-binet-ssearchrestart
然后你再錄入的就會被使用這個詞分,原來已經(jīng)錄入的,那就只能重做索引啦!
總結(jié)
- 上一篇: bootstrap导航条文字颜色_XEd
- 下一篇: GYP构建系统总结