【solr基础教程之一】Solr相关知识点串讲
生活随笔
收集整理的這篇文章主要介紹了
【solr基础教程之一】Solr相关知识点串讲
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
? ? ? 一、概述
? (一)基礎內容 1、Solr的版本號與Lucene的版本號保持一直,直到2014年7月,最新版本號為4.9.0。 2、Solr提供了一個example,可以簡單快速的搭建起搜索環境。參見http://blog.csdn.net/jediael_lu/article/details/36419497 ? ?(二)配置文件 Solr的關鍵配置文件有以下三個: solr.xml—Defines properties related to administration, logging, sharding, and SolrCloud? solrconfig.xml—Defines the main settings for a specific Solr core schema.xml—Defines the structure of your index, including fields and field types 啟動搜索引擎時,服務器按照以下順序導入配置: (1)從全局java系統屬性中查看solr.solr.home,一般定義為:$SOLR_INSTALL/example/solr/。 (2)搜索上述目錄中哪個子目錄中包含有?core.properties,每個?core.properties對應一個core。 (3)從?core.properties中找出name屬性,其值作為一個core。 (4)查找這個core下面的conf子目錄,找到solrconfig.xml與schema.xml。 ? ?1、solr.xml 與整個搜索引擎相關的配置。 2、solrconfig.xml。 與某個core相關的主要配置,如定義updatehandler用于索引文件,requesthandler用于搜索內容等。
? ? 3、schema.xml 定義了某類型文檔的索引格式。 4、core.properties 記錄了一個core的基本信息,除一個name為必備屬性外,其余均為可選。
? ? ?二、索引 索引,是將文檔中的內容經過分析后,形成一個Term---Document的映射,并將其寫入索引文件的過程,即說明哪些文檔中包括某個詞匯。 (一)向搜索引擎中提交文檔的方法 1、命令行方式 使用example程序中提供的post.jar或者post.sh提供文檔,它支持XML/JSON/CSV三種文件格式。 如java -jar post.jar *.xml 但本質上,它只是將solr提供的API進行了封裝,最核心的類為SimplePostTool,此類調用了SolrJ的接口。 2、SolrJ 使用solr提供的API,進行文檔的添加。 3、其它第三方工具 (1)Data Import Handler (DIH) 將外部數據導入Solr,如網站、關系型數據庫等內容。 (2)ExtractingRequestHandler, aka Solr Cell 對Tika進行了封裝,可用于導入富文本內容,如pdf,office等 (3)Nutch 抓取網頁并將其導入solr。
? ??三、分析
? ? 四、索引
?? ?五、擴展功能
總結
以上是生活随笔為你收集整理的【solr基础教程之一】Solr相关知识点串讲的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: solr源码导入eclipse
- 下一篇: 使用LAMP创建基于wordpress的