新版本ISR 为啥 移除replica.lag.max.messages这个参数
ISR
上節我們涉及到ISR (In-Sync Replicas),這個是指副本同步隊列。副本數對Kafka的吞吐率是有一定的影響,但極大的增強了可用性。默認情況下Kafka的replica數量為1,即每個partition都有一個唯一的leader,為了確保消息的可靠性,通常應用中將其值(由broker的參數offsets.topic.replication.factor指定)大小設置為大于1,比如3。 所有的副本(replicas)統稱為Assigned Replicas,即AR。ISR是AR中的一個子集,由leader維護ISR列表,follower從leader同步數據有一些延遲(包括延遲時間replica.lag.time.max.ms和延遲條數replica.lag.max.messages兩個維度, 當前最新的版本0.10.x中只支持replica.lag.time.max.ms這個維度),任意一個超過閾值都會把follower剔除出ISR, 存入OSR(Outof-Sync Replicas)列表,新加入的follower也會先存放在OSR中。AR=ISR+OSR。
Kafka 0.9.0.0版本后移除了replica.lag.max.messages參數,只保留了replica.lag.time.max.ms作為ISR中副本管理的參數。為什么這樣做呢?replica.lag.max.messages表示當前某個副本落后leader的消息數量超過了這個參數的值,那么leader就會把follower從ISR中刪除。假設設置replica.lag.max.messages=4,那么如果producer一次傳送至broker的消息數量都小于4條時,因為在leader接受到producer發送的消息之后而follower副本開始拉取這些消息之前,follower落后leader的消息數不會超過4條消息,故此沒有follower移出ISR,所以這時候replica.lag.max.message的設置似乎是合理的。但是producer發起瞬時高峰流量,producer一次發送的消息超過4條時,也就是超過replica.lag.max.messages,此時follower都會被認為是與leader副本不同步了,從而被踢出了ISR。但實際上這些follower都是存活狀態的且沒有性能問題。那么在之后追上leader,并被重新加入了ISR。于是就會出現它們不斷地剔出ISR然后重新回歸ISR,這無疑增加了無謂的性能損耗。而且這個參數是broker全局的。設置太大了,影響真正“落后”follower的移除;設置的太小了,導致follower的頻繁進出。無法給定一個合適的replica.lag.max.messages的值,故此,新版本的Kafka移除了這個參數。
?
總結
以上是生活随笔為你收集整理的新版本ISR 为啥 移除replica.lag.max.messages这个参数的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: windows下部署oracle11,w
- 下一篇: oracle用户手册在哪里,Oracle