mac solr mysql 配置文件_Solr配置文件浅析
接上一篇Linux下安裝solr7.4,來(lái)談?wù)剆olr的配置文件schema.xml和db-data-config.xml
首先看schema.xml:
id
field標(biāo)簽用來(lái)定義solr core中的字段。這里列出的三個(gè)字段如果沒有特殊原因盡量保留。字段id被聲明為uniqueKey,是讓id來(lái)唯一標(biāo)明一個(gè)solrdocument。通過(guò)這個(gè)id來(lái)對(duì)solrdocument進(jìn)行操作。
type對(duì)應(yīng)的是字段的屬性,solr在schema中定義了很多屬性,當(dāng)然也可以自己定義屬性。這里常見的屬性有pint,pdate,string,boolean等。
不常見或者自定義的屬性:
該屬性type="text_ws"定義的字段通過(guò)空格去分割文本變成一個(gè)一個(gè)的詞,然后可以通過(guò)被分割的詞去查找該document。
這里用到的逆向索引是solr的精髓,將分好的詞作為key,文檔標(biāo)簽作為value,對(duì)key建索引,去查詢文檔。
indexed屬性如果為true則說(shuō)明該字段將被建索引。
stored屬性如果為true,則將該字段內(nèi)容進(jìn)行存儲(chǔ)。
multiValued如果設(shè)置為true,則表明該字段是由多個(gè)字段值組成的。比如上面例子中的text字段,它是由content和title字段組成。對(duì)text字段的操作就是對(duì)content和title字段進(jìn)行操作。
上面這一段配置的意思是:有兩個(gè)字段title和content,他們是自定義的text_hanlp屬性,含有這屬性的字段都接受hanlp的分詞。這兩個(gè)字段不創(chuàng)建索引,只做存儲(chǔ)。text字段負(fù)責(zé)組合title和content字段,并創(chuàng)建索引用來(lái)檢索。
required屬性表明該字段值是否必須。
自定義屬性text_hanlp來(lái)達(dá)到中文分詞效果
因?yàn)閟olr常用的ik分詞、mmseg4j都已經(jīng)不維護(hù)了。所以這里使用還有大神維護(hù)的Hanlp分詞器。
配置Hanlp分詞可以參考教程
將hanlp-portable.jar和hanlp-lucene-plugin.jar共兩個(gè)jar放入${tomcat}/webapps/solr/WEB-INF/lib下
配置好之后,可以在solr admin界面查看分詞效果:
solr分詞
定義動(dòng)態(tài)字段
dynamicField定義的就是動(dòng)態(tài)字段,只要符合_i結(jié)尾的字段都可以被這個(gè)字段所定義。同樣的,schema.xml中已經(jīng)定義好了很多動(dòng)態(tài)字段。可以直接拿來(lái)用。
db-data-config.xml配置文件
該文件主要配置數(shù)據(jù)庫(kù)連接和字段對(duì)應(yīng)關(guān)系。用來(lái)做全量和增量索引的創(chuàng)建,相對(duì)schema.xml簡(jiǎn)單很多。
下面看下主要配置:
url="jdbc:mysql://127.0.0.1:3306/database?
useUnicode=true&characterEncoding=UTF-8"
user="root"
batchSize="-1"
password="123456"/>
dataSource用來(lái)定義數(shù)據(jù)庫(kù)連接,batchSize設(shè)為-1是為了避免查詢創(chuàng)建索引導(dǎo)致內(nèi)存溢出。
query="select * from tableName" >
這里做了一個(gè)簡(jiǎn)單的定義,看著很清楚。columen標(biāo)明的是數(shù)據(jù)庫(kù)查出的字段,name標(biāo)明的屬性和schema中定義的字段對(duì)應(yīng)。
deltaQuery="select id from item where last_modified > '${dataimporter.last_index_time}'">
deltaQuery用來(lái)做增量索引的創(chuàng)建。
當(dāng)文件配置好之后,重啟tomcat。訪問(wèn)solr/index.html。
solr創(chuàng)建索引
選擇1,然后2可以選擇全量索引或者創(chuàng)建增量索引。勾選clean會(huì)清楚上次的索引,點(diǎn)選commit創(chuàng)建索引進(jìn)行提交。點(diǎn)擊execute進(jìn)行執(zhí)行。
下一篇,更新spring boot 中集成solrJ對(duì)solr進(jìn)行操作。
創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎(jiǎng)勵(lì)來(lái)咯,堅(jiān)持創(chuàng)作打卡瓜分現(xiàn)金大獎(jiǎng)總結(jié)
以上是生活随笔為你收集整理的mac solr mysql 配置文件_Solr配置文件浅析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: java mysql nullpoint
- 下一篇: mysql 更改root密码字段不存在_