日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

solr中文分词

發布時間:2025/4/16 编程问答 20 豆豆
生活随笔 收集整理的這篇文章主要介紹了 solr中文分词 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1.簡介

Solr是一個高性能,采用Java5開發,Solr基于Lucene的全文搜索服務器。同時對其進行了擴展,提供了比Lucene更為豐富的查詢語言,同時實現了可配置、可擴展并對查詢性能進行了優化,并且提供了一個完善的功能管理界面,是一款非常優秀的全文搜索引擎。因為中文的特殊性,在對中文文檔建立全文索引時,需要利用分詞工具進行分詞。

目前比較知名的分詞工具有:
IK,庖丁等

2.下載

?solr鏈接:https://pan.baidu.com/s/1iitpaYgBVpXQSUABtkCm5Q?
提取碼:tuuo?

3.安裝

解壓文件。

進入bin 啟動solr

./solr start -p 8984

可以在ip:8984端口上查看solr情況

關閉solr

./solr stop -all

4.中文分詞配置

copy ik-analyzer-solr5-5.x.jar to server/solr-webapp/webapp/WEB-INF/lib

ik-analyzer-solr5-5.x.jar 下載地址:鏈接:https://pan.baidu.com/s/1MlzginuetwyONGQ5KbtnOg?
提取碼:7g7z?

?

/usr/local/solr/solr-5.4.0/server/solr-webapp/webapp/WEB-INF/lib

修改schema.xml

<fieldType name="text_ik" class="solr.TextField"> <analyzer type="index"> <tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" /> </analyzer><analyzer type="query"><tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" /></analyzer></fieldType>

<field name="docContent" type="text_ik" indexed="true" stored="true" multiValued="true"/>

<field name="docType" type="text_ik" indexed="true" stored="true" multiValued="true"/>

<field name="docName" type="text_ik" indexed="true" stored="true" multiValued="true"/>

重啟solr

檢測:
進入solr管理頁面-->analysis 查看分詞結果

?

轉載于:https://www.cnblogs.com/pigdata/p/10305562.html

總結

以上是生活随笔為你收集整理的solr中文分词的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。