日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 运维知识 > 数据库 >内容正文

数据库

mac solr mysql 配置文件_Solr配置文件浅析

發(fā)布時(shí)間:2023/12/2 数据库 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 mac solr mysql 配置文件_Solr配置文件浅析 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

接上一篇Linux下安裝solr7.4,來(lái)談?wù)剆olr的配置文件schema.xml和db-data-config.xml

首先看schema.xml:

id

field標(biāo)簽用來(lái)定義solr core中的字段。這里列出的三個(gè)字段如果沒有特殊原因盡量保留。字段id被聲明為uniqueKey,是讓id來(lái)唯一標(biāo)明一個(gè)solrdocument。通過(guò)這個(gè)id來(lái)對(duì)solrdocument進(jìn)行操作。

type對(duì)應(yīng)的是字段的屬性,solr在schema中定義了很多屬性,當(dāng)然也可以自己定義屬性。這里常見的屬性有pint,pdate,string,boolean等。

不常見或者自定義的屬性:

該屬性type="text_ws"定義的字段通過(guò)空格去分割文本變成一個(gè)一個(gè)的詞,然后可以通過(guò)被分割的詞去查找該document。

這里用到的逆向索引是solr的精髓,將分好的詞作為key,文檔標(biāo)簽作為value,對(duì)key建索引,去查詢文檔。

indexed屬性如果為true則說(shuō)明該字段將被建索引。

stored屬性如果為true,則將該字段內(nèi)容進(jìn)行存儲(chǔ)。

multiValued如果設(shè)置為true,則表明該字段是由多個(gè)字段值組成的。比如上面例子中的text字段,它是由content和title字段組成。對(duì)text字段的操作就是對(duì)content和title字段進(jìn)行操作。

上面這一段配置的意思是:有兩個(gè)字段title和content,他們是自定義的text_hanlp屬性,含有這屬性的字段都接受hanlp的分詞。這兩個(gè)字段不創(chuàng)建索引,只做存儲(chǔ)。text字段負(fù)責(zé)組合title和content字段,并創(chuàng)建索引用來(lái)檢索。

required屬性表明該字段值是否必須。

自定義屬性text_hanlp來(lái)達(dá)到中文分詞效果

因?yàn)閟olr常用的ik分詞、mmseg4j都已經(jīng)不維護(hù)了。所以這里使用還有大神維護(hù)的Hanlp分詞器。

配置Hanlp分詞可以參考教程

將hanlp-portable.jar和hanlp-lucene-plugin.jar共兩個(gè)jar放入${tomcat}/webapps/solr/WEB-INF/lib下

配置好之后,可以在solr admin界面查看分詞效果:

solr分詞

定義動(dòng)態(tài)字段

dynamicField定義的就是動(dòng)態(tài)字段,只要符合_i結(jié)尾的字段都可以被這個(gè)字段所定義。同樣的,schema.xml中已經(jīng)定義好了很多動(dòng)態(tài)字段。可以直接拿來(lái)用。

db-data-config.xml配置文件

該文件主要配置數(shù)據(jù)庫(kù)連接和字段對(duì)應(yīng)關(guān)系。用來(lái)做全量和增量索引的創(chuàng)建,相對(duì)schema.xml簡(jiǎn)單很多。

下面看下主要配置:

url="jdbc:mysql://127.0.0.1:3306/database?

useUnicode=true&characterEncoding=UTF-8"

user="root"

batchSize="-1"

password="123456"/>

dataSource用來(lái)定義數(shù)據(jù)庫(kù)連接,batchSize設(shè)為-1是為了避免查詢創(chuàng)建索引導(dǎo)致內(nèi)存溢出。

query="select * from tableName" >

這里做了一個(gè)簡(jiǎn)單的定義,看著很清楚。columen標(biāo)明的是數(shù)據(jù)庫(kù)查出的字段,name標(biāo)明的屬性和schema中定義的字段對(duì)應(yīng)。

deltaQuery="select id from item where last_modified > '${dataimporter.last_index_time}'">

deltaQuery用來(lái)做增量索引的創(chuàng)建。

當(dāng)文件配置好之后,重啟tomcat。訪問(wèn)solr/index.html。

solr創(chuàng)建索引

選擇1,然后2可以選擇全量索引或者創(chuàng)建增量索引。勾選clean會(huì)清楚上次的索引,點(diǎn)選commit創(chuàng)建索引進(jìn)行提交。點(diǎn)擊execute進(jìn)行執(zhí)行。

下一篇,更新spring boot 中集成solrJ對(duì)solr進(jìn)行操作。

創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎(jiǎng)勵(lì)來(lái)咯,堅(jiān)持創(chuàng)作打卡瓜分現(xiàn)金大獎(jiǎng)

總結(jié)

以上是生活随笔為你收集整理的mac solr mysql 配置文件_Solr配置文件浅析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。