日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【solr基础教程之一】Solr相关知识点串讲

發布時間:2024/1/23 编程问答 30 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【solr基础教程之一】Solr相关知识点串讲 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.





Solr是Apache Lucene的一個子項目。Lucene為全文搜索功能提供了完備的API,但它只作為一個API庫存在,而不能直接用于搜索。因此,Solr基于Lucene構建了一個完整的搜索引擎,它可以為搜索引擎添加文檔,對文檔內容進行分析,并為用戶提供搜索功能,在此基礎上提供了一個擴展功能,如hit highline, suggetion等。

? ? ? 一、概述

? (一)基礎內容 1、Solr的版本號與Lucene的版本號保持一直,直到2014年7月,最新版本號為4.9.0。 2、Solr提供了一個example,可以簡單快速的搭建起搜索環境。參見http://blog.csdn.net/jediael_lu/article/details/36419497 ? ?(二)配置文件 Solr的關鍵配置文件有以下三個: solr.xml—Defines properties related to administration, logging, sharding, and SolrCloud? solrconfig.xml—Defines the main settings for a specific Solr core schema.xml—Defines the structure of your index, including fields and field types 啟動搜索引擎時,服務器按照以下順序導入配置: (1)從全局java系統屬性中查看solr.solr.home,一般定義為:$SOLR_INSTALL/example/solr/。 (2)搜索上述目錄中哪個子目錄中包含有?core.properties,每個?core.properties對應一個core。 (3)從?core.properties中找出name屬性,其值作為一個core。 (4)查找這個core下面的conf子目錄,找到solrconfig.xml與schema.xml。 ? ?

1、solr.xml 與整個搜索引擎相關的配置。 2、solrconfig.xml。 與某個core相關的主要配置,如定義updatehandler用于索引文件,requesthandler用于搜索內容等。


? ? 3、schema.xml 定義了某類型文檔的索引格式。 4、core.properties 記錄了一個core的基本信息,除一個name為必備屬性外,其余均為可選。

? ? ?二、索引 索引,是將文檔中的內容經過分析后,形成一個Term---Document的映射,并將其寫入索引文件的過程,即說明哪些文檔中包括某個詞匯。 (一)向搜索引擎中提交文檔的方法 1、命令行方式 使用example程序中提供的post.jar或者post.sh提供文檔,它支持XML/JSON/CSV三種文件格式。 如java -jar post.jar *.xml 但本質上,它只是將solr提供的API進行了封裝,最核心的類為SimplePostTool,此類調用了SolrJ的接口。 2、SolrJ 使用solr提供的API,進行文檔的添加。 3、其它第三方工具 (1)Data Import Handler (DIH) 將外部數據導入Solr,如網站、關系型數據庫等內容。 (2)ExtractingRequestHandler, aka Solr Cell 對Tika進行了封裝,可用于導入富文本內容,如pdf,office等 (3)Nutch 抓取網頁并將其導入solr。


? ??三、分析


? ? 四、索引


?? ?五、擴展功能

總結

以上是生活随笔為你收集整理的【solr基础教程之一】Solr相关知识点串讲的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。