當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Elasticsearch入门（一）基本介绍与安装

發布時間：2023/12/29 编程问答 26 豆豆

生活随笔收集整理的這篇文章主要介紹了 Elasticsearch入门（一）基本介绍与安装小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

視頻學習：018-入門-JavaAPI-環境準備_嗶哩嗶哩_bilibili

介紹：

Elaticsearch：簡稱為 ES，ES 是一個開源的高擴展的分布式全文搜索引擎，是整個 Elastic Stack 技術棧的核心。它可以近乎實時的存儲、檢索數據；本身擴展性很好，可以擴展到上百臺服務器，處理 PB 級別的數據。我們要是進行全文檢索項目的開發，建議優先考慮elasticsearch。

全文索引：它的工作原理是計算機索引程序通過掃描文章中的每一個詞，對每一個詞建立一個索引，指明該詞在文章中出現的次數和位置，當用戶查詢時，檢索程序就根據事先建立的索引進行查找，并將查找的結果反饋給用戶的檢索方式。這個過程類似于通過字典中的檢索字表查字的過程。

特點：

1、elasticsearch是一個基于Lucene的高擴展的分布式搜索服務器，支持開箱即用。
2、elasticsearch隱藏了Lucene的復雜性，對外提供Restful 接口來操作索引、搜索。?

安裝

下載地址：https://www.elastic.co/cn/downloads/past-releases#elasticsearch

這里我為了方便演示使用的是 elasticsearch-7.17.7 windows版，需要javaJDK1.8及以上。解壓即安裝完畢，解壓后的 Elasticsearch 的目錄結構如下?

bin	可執行腳本目錄
config	配置目錄
jdk	內置JDK目錄
lib	類庫
logs	日志目錄
moudules	模塊目錄
plugins	插件目錄

?啟動：進入 bin 文件目錄，點擊 elasticsearch.bat 文件啟動 ES 服務

注意:9300?端口為 Elasticsearch 集群間組件的通信端口，9200?端口為瀏覽器訪問的 http協議 RESTful 端口。

瀏覽器輸入地址：http://localhost:9200，測試：

?補充：

默認安裝包帶有 jdk 環境，如果系統配置 JAVA_HOME，那么使用系統默認的 JDK，如果沒有配置使用自帶的 JDK，一般建議使用系統配置的 JDK。
雙擊啟動窗口閃退，通過路徑訪問追蹤錯誤，如果是“空間不足”，請修改config/jvm.options 配置文件

# 設置 JVM 初始內存為 1G。此值可以設置與-Xmx 相同，以避免每次垃圾回收完成后 JVM 重新分配內存 # Xms represents the initial size of total heap space # 設置 JVM 最大可用內存為 1G # Xmx represents the maximum size of total heap space -Xms1g -Xmx1g

?安裝Kibana

下載地址：https://www.elastic.co/cn/downloads/kibana

?下載后進行解壓，目錄如圖：

修改中文：根目錄下的 config 目錄，打開?kibana.yml?文件添加：

# 默認端口 server.port: 5601 # ES 服務器的地址 elasticsearch.hosts: ["http://localhost:9200"] # 索引名 kibana.index: ".kibana" # 支持中文 i18n.locale: "zh-CN"

進入 bin 目錄，雙擊?kibana.bat?啟動服務

啟動 Kibana 之前要啟動 Elasticsearch

訪問：http://localhost:5601/

kibana 會自動去訪問 9200，也就是 elasticsearch 的端口號

名詞概念：

索引（Index）

一個索引就是一個擁有幾分相似特征的文檔的集合。比如說，你可以有一個客戶數據的索引，另一個產品目錄的索引，還有一個訂單數據的索引。一個索引由一個名字來標識（必須全部是小寫字母），并且當我們要對這個索引中的文檔進行檢索、搜索、更新和刪除的時候，都要使用到這個名字。在一個集群中，可以定義任意多的索引。

能搜索的數據必須有索引，這樣的好處是可以提高查詢速度，比如：新華字典前面的目錄就是索引的意思，目錄可以提高查詢速度。

Elasticsearch 索引的精髓：一切設計都是為了提高搜索的性能。

類型（Type）

在一個索引中，你可以定義一種或多種類型。

一個類型是你的索引的一個邏輯上的分類/分區，其語義完全由你來定。通常，會為具有一組共同字段的文檔定義一個類型。不同的版本，類型發生了不同的變化

版本Type

5.x	支持多種 type
6.x	支持多種 type
7.x	默認不再支持自定義索引類型（默認類型為：_doc）

文檔（Document）

一個文檔是一個可被檢索的基礎信息單元，也就是一條數據。

比如：你可以擁有某一個客戶的文檔，某一個產品的一個文檔，當然，也可以擁有某個訂單的一個文檔。文檔以 JSON（Javascript Object Notation）格式來表示，而 JSON 是一個到處存在的互聯網數據交互格式。

在一個 index/type 里面，你可以存儲任意多的文檔。

字段（Field）

相當于是數據表的字段，對文檔數據根據不同屬性進行的分類標識。

映射（Mapping）

mapping 是處理數據的方式和規則方面做一些限制，如：某個字段的數據類型、默認值、分析器、是否被檢索等等。這些都是映射里面可以設置的，其它就是處理 ES 里面數據的一些使用規則設置也叫做映射，按著最優規則處理數據對性能提高很大，因此才需要建立映射，并且需要思考如何建立映射才能對性能更好。

分片（Shards）

一個索引可以存儲超出單個節點硬件限制的大量數據。比如，一個具有 10 億文檔數據的索引占據 1TB 的磁盤空間，而任一節點都可能沒有這樣大的磁盤空間。或者單個節點處理搜索請求，響應太慢。為了解決這個問題，Elasticsearch 提供了將索引劃分成多份的能力，每一份就稱之為分片。當你創建一個索引的時候，你可以指定你想要的分片的數量。每個分片本身也是一個功能完善并且獨立的「索引」，這個「索引」可以被放置到集群中的任何節點上。

分片很重要，主要有兩方面的原因：

允許你水平分割/擴展你的內容容量
允許你在分片之上進行分布式的、并行的操作，進而提高性能/吞吐量

至于一個分片怎樣分布，它的文檔怎樣聚合和搜索請求，是完全由 Elasticsearch 管理的，對于作為用戶的你來說，這些都是透明的，無需過分關心。

如同完整的大數據，分割成多個小數據，分布到不同的地方，小數據就是分片，所有的分片合起來就是完整的數據

被混淆的概念是：一個 Lucene 索引，我們在 Elasticsearch 稱作分片。一個 Elasticsearch 索引是分片的集合。當 Elasticsearch 在索引中搜索的時候，他發送查詢到每一個屬于索引的分片(Lucene 索引)，然后合并每個分片的結果到一個全局的結果集

副本（Replicas）

在一個網絡/云的環境里，失敗隨時都可能發生，在某個分片/節點不知怎么的就處于離線狀態，或者由于任何原因消失了，這種情況下，有一個故障轉移機制是非常有用并且是強烈推薦的。為此目的，Elasticsearch 允許你創建分片的一份或多份拷貝，這些拷貝叫做復制分片(副本)。

復制分片之所以重要，有兩個主要原因：

在分片/節點失敗的情況下，提供了高可用性。因為這個原因，注意到復制分片從不與原/主要（original/primary）分片置于同一節點上是非常重要的
擴展你的搜索量/吞吐量，因為搜索可以在所有的副本上并行運行

總之，每個索引可以被分成多個分片。一個索引也可以被復制 0 次（意思是沒有復制）或多次。一旦復制了，每個索引就有了主分片（作為復制源的原來的分片）和復制分片（主分片的拷貝）之別。分片和復制的數量可以在索引創建的時候指定。在索引創建之后，你可以在任何時候動態地改變復制的數量，但是你事后不能改變分片的數量。默認情況下，Elasticsearch 中的每個索引被分片 1 個主分片和 1 個復制，這意味著，如果你的集群中至少有兩個節點，你的索引將會有 1 個主分片和另外 1 個復制分片（1 個完全拷貝），這樣的話每個索引總共就有 2 個分片，我們需要根據索引需要確定分片個數.

副本就是分片的備份(分身)，和數據庫的主從復制類似

分配（Allocation）

將分片分配給某個節點的過程，包括分配主分片或者副本。如果是副本，還包含從主分片復制數據的過程。這個過程是由 master 節點完成的。

總結

以上是生活随笔為你收集整理的Elasticsearch入门（一）基本介绍与安装的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：【pip报错】Could not fet
下一篇：学习笔记21.07.10：绘制页面组合图