當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

简单分析KafKa工作原理

發(fā)布時間：2023/12/3 编程问答 31 豆豆

生活随笔收集整理的這篇文章主要介紹了简单分析KafKa工作原理小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

架構(gòu)圖

Producer：Producer即生產(chǎn)者，消息的產(chǎn)生者，是消息的入口。

kafka cluster：
Broker：Broker是kafka實例，每個服務器上有一個或多個kafka的實例，我們姑且認為每個broker對應一臺服務器。每個kafka集群內(nèi)的broker都有一個不重復的編號，如圖中的broker-0、broker-1等……

Topic：消息的主題，可以理解為消息的分類，kafka的數(shù)據(jù)就保存在topic。在每個broker上都可以創(chuàng)建多個topic。
Partition：Topic的分區(qū)，每個topic可以有多個分區(qū)，分區(qū)的作用是做負載，提高kafka的吞吐量。同一個topic在不同的分區(qū)的數(shù)據(jù)是不重復的，partition的表現(xiàn)形式就是一個一個的文件夾！
Replication:每一個分區(qū)都有多個副本，副本的作用是做備胎。當主分區(qū)（Leader）故障的時候會選擇一個備胎（Follower）上位，成為Leader。在kafka中默認副本的最大數(shù)量是10個，且副本的數(shù)量不能大于Broker的數(shù)量，follower和leader絕對是在不同的機器，同一機器對同一個分區(qū)也只可能存放一個副本（包括自

Message：每一條發(fā)送的消息主體。

Consumer：消費者，即消息的消費方，是消息的出口。

Consumer Group：我們可以將多個消費組組成一個消費者組，在kafka的設計中同一個分區(qū)的數(shù)據(jù)只能被消費者組中的某一個消費者消費。同一個消費者組的消費者可以消費同一個topic的不同分區(qū)的數(shù)據(jù)，這也是為了提高kafka的吞吐量！

Zookeeper：kafka集群依賴zookeeper來保存集群的的元信息，來保證系統(tǒng)的可用性。

Partition的組成

Partition在服務器上的表現(xiàn)形式就是一個一個的文件夾，每個partition的文件夾下面會有多組segment文件，每組segment文件又包含.index文件、.log文件、.timeindex文件（早期版本中沒有）三個文件， log文件就實際是存儲message的地方，而index和timeindex文件為索引文件，用于檢索消息。

如上圖，這個partition有三組segment文件，每個log文件的大小是一樣的，但是存儲的message數(shù)量是不一定相等的（每條的message大小不一致）。文件的命名是以該segment最小offset來命名的，如000.index存儲offset為0~368795的消息，kafka就是利用分段+索引的方式來解決查找效率的問題。

存儲策略

無論消息是否被消費，kafka都會保存所有的消息。那對于舊數(shù)據(jù)有什么刪除策略呢？

基于時間，默認配置是168小時（7天）。

基于大小，默認配置是1073741824。

需要注意的是，kafka讀取特定消息的時間復雜度是O(1)，所以這里刪除過期的文件并不會提高kafka的性能！

日志復制

Kafka 允許 topic 的 partition 擁有若干副本，你可以在server端配置partition 的副本數(shù)量。當集群中的節(jié)點出現(xiàn)故障時，能自動進行故障轉(zhuǎn)移，保證數(shù)據(jù)的可用性。

創(chuàng)建副本的單位是 topic 的 partition ，正常情況下，每個分區(qū)都有一個 leader 和零或多個 followers 。

所有的讀寫操作都由 leader 處理，一般 partition 的數(shù)量都比 broker 的數(shù)量多的多，各分區(qū)的 leader 均勻的分布在brokers 中。所有的 followers 節(jié)點都同步 leader 節(jié)點的日志，日志中的消息和偏移量都和 leader 中的一致。（當然, 在任何給定時間, leader 節(jié)點的日志末尾時可能有幾個消息尚未被備份完成）。

Followers 節(jié)點就像普通的 consumer 那樣從 leader 節(jié)點那里拉取消息并保存在自己的日志文件中。Followers 節(jié)點可以從 leader 節(jié)點那里批量拉取消息日志到自己的日志文件中。

與大多數(shù)分布式系統(tǒng)一樣，自動處理故障需要精確定義節(jié)點 “alive” 的概念。Kafka 判斷節(jié)點是否存活有兩種方式。

節(jié)點必須可以維護和 ZooKeeper 的連接，Zookeeper 通過心跳機制檢查每個節(jié)點的連接。

如果節(jié)點是個 follower ，它必須能及時的同步 leader 的寫操作，并且延時不能太久。

Kafka認為滿足這兩個條件的節(jié)點處于 “in sync” 狀態(tài)，區(qū)別于 “alive” 和 “failed” 。 Leader會追蹤所有 “in sync” 的節(jié)點。如果有節(jié)點掛掉了, 或是寫超時, 或是心跳超時, leader 就會把它從同步副本列表中移除。同步超時和寫超時的時間由 replica.lag.time.max.ms 配置確定。

現(xiàn)在, 我們可以更精確地定義, 只有當消息被所有的副本節(jié)點加入到日志中時, 才算是提交, 只有提交的消息才會被 consumer 消費, 這樣就不用擔心一旦 leader 掛掉了消息會丟失。另一方面， producer 也可以選擇是否等待消息被提交，這取決他們的設置在延遲時間和持久性之間的權衡，這個選項是由 producer 使用的 acks 設置控制。請注意，Topic 可以設置同步備份的最小數(shù)量， producer 請求確認消息是否被寫入到所有的備份時, 可以用最小同步數(shù)量判斷。如果 producer 對同步的備份數(shù)沒有嚴格的要求，即使同步的備份數(shù)量低于最小同步數(shù)量（例如，僅僅只有 leader 同步了數(shù)據(jù)），消息也會被提交，然后被消費。

ISR機制（一致性）

Kafka 動態(tài)維護了一個同步狀態(tài)的備份的集合（a set of in-sync replicas），簡稱 ISR ，在這個集合中的節(jié)點都是和 leader 保持高度一致的，只有這個集合的成員才有資格被選舉為 leader，一條消息必須被這個集合所有節(jié)點讀取并追加到日志中了，這條消息才能視為提交。這個 ISR 集合發(fā)生變化會在 ZooKeeper 持久化，正因為如此，這個集合中的任何一個節(jié)點都有資格被選為 leader 。這對于 Kafka 使用模型中，有很多分區(qū)和并確保主從關系是很重要的。因為 ISR 模型和 f+1 副本，一個 Kafka topic 冗余 f 個節(jié)點故障而不會丟失任何已經(jīng)提交的消息。

向 Kafka 寫數(shù)據(jù)時，producers 設置 ack 是否提交完成， 0：不等待broker返回確認消息,1: leader保存成功返回或, -1(all): 所有備份都保存成功返回.請注意. 設置 “ack = all” 并不能保證所有的副本都寫入了消息。默認情況下，當 acks = all 時，只要 ISR 副本同步完成，就會返回消息已經(jīng)寫入。

性能優(yōu)化

順序?qū)懘疟P

將寫磁盤的過程變?yōu)轫樞驅(qū)?#xff0c;可極大提高對磁盤的利用率。Consumer通過offset順序消費這些數(shù)據(jù)，且不刪除已經(jīng)消費的數(shù)據(jù)，從而避免隨機寫磁盤的過程。
Kafka刪除舊數(shù)據(jù)的方式是刪除整個Segment對應的log文件和整個index文件，而不是刪除部分內(nèi)容。

充分利用Page Cache（內(nèi)核緩存）

相比于維護盡可能多的 in-memory cache，并且在空間不足的時候匆忙將數(shù)據(jù) flush 到文件系統(tǒng)，我們把這個過程倒過來。所有數(shù)據(jù)一開始就被寫入到文件系統(tǒng)的持久化日志中，而不用在 cache 空間不足的時候 flush 到磁盤。實際上，這表明數(shù)據(jù)被轉(zhuǎn)移到了內(nèi)核的 pagecache 中。

Page Cache的優(yōu)點：

I/O Scheduler會將連續(xù)的小塊寫組裝成大塊的物理寫從而提高性能。

I/O Scheduler會嘗試將一些寫操作重新按順序排好，從而減少磁頭移動時間。

充分利用所有空閑內(nèi)存（非JVM內(nèi)存）。

讀操作可以直接在Page Cache內(nèi)進行。如果消費和生產(chǎn)速度相當，甚至不需要通過物理磁盤交換數(shù)據(jù)。

如果進程重啟，JVM內(nèi)的Cache會失效，但Page Cache仍然可用。

零拷貝

Kafka中存在大量網(wǎng)絡數(shù)據(jù)持久化到磁盤（Producer到Broker）和磁盤文件通過網(wǎng)絡發(fā)送（Broker到Consumer）的過程，這個過程中傳統(tǒng)模式下要進行數(shù)據(jù)的四次拷貝，Kafka通過零拷貝技術（sendfile）提交效率

減少網(wǎng)絡開銷

在某些情況下，數(shù)據(jù)傳輸?shù)钠款i不是 CPU ，也不是磁盤，而是網(wǎng)絡帶寬。對于需要通過廣域網(wǎng)在數(shù)據(jù)中心之間發(fā)送消息的數(shù)據(jù)管道尤其如此。當然，用戶可以在不需要 Kakfa 支持下一次一個的壓縮消息。但是這樣會造成非常差的壓縮比和消息重復類型的冗余，比如 JSON 中的字段名稱或者是或 Web 日志中的用戶代理或公共字符串值。高性能的壓縮是一次壓縮多個消息，而不是壓縮單個消息。

Kafka 以高效的批處理格式支持一批消息可以壓縮在一起發(fā)送到服務器。這批消息將以壓縮格式寫入，并且在日志中保持壓縮，只會在 consumer 消費時解壓縮。

Kafka 支持 GZIP，Snappy 和 LZ4 壓縮協(xié)議

參考

kafka中文文檔
kafka-CAP理論
Kafka工作原理

總結(jié)

以上是生活随笔為你收集整理的简单分析KafKa工作原理的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：香港域名注册怎么绑定ip（如何注册香港域
下一篇：常用限流算法分析