理解分布式一致性:Raft协议
理解分布式一致性:Raft協(xié)議
- 什么是分布式一致性
- Leader選舉
- 日志復(fù)制流程
- term選舉周期
- timeout
- 選舉和選舉timeout
- 選舉分裂
- 日志復(fù)制和心跳timeout
在分布式系統(tǒng)中,分布式一致性是一個(gè)非常重要的概念,它是指分布式系統(tǒng)的各個(gè)服務(wù)器都保持一個(gè)統(tǒng)一的狀態(tài)(數(shù)據(jù))。但是在分布式系統(tǒng)中,通常由于網(wǎng)絡(luò),系統(tǒng)狀態(tài)等原因會導(dǎo)致某些服務(wù)不可用或者不可靠。這就需要一種分布式一致性的協(xié)議來保證系統(tǒng)在某些服務(wù)失敗的情況下仍然整體可用。
Raft協(xié)議是受到Paxos的影響而產(chǎn)生的,相對于Paxos而言,Raft協(xié)議更加簡單易懂。我會在后面的博客里面專門詳細(xì)介紹Paxos協(xié)議的具體內(nèi)容。這里我們重點(diǎn)討論Raft協(xié)議。
什么是分布式一致性
下面舉個(gè)例子:
假如我們有一個(gè)單節(jié)點(diǎn)的服務(wù)節(jié)點(diǎn)A,這個(gè)單節(jié)點(diǎn)的服務(wù)只是用來存儲一個(gè)字母。同時(shí)我們還有一個(gè)客戶端向這個(gè)服務(wù)發(fā)起更新數(shù)據(jù)的請求。
對于單節(jié)點(diǎn)的分布式一致性來說,服務(wù)響應(yīng)客戶端的更新請求即可。但是當(dāng)我們有多個(gè)服務(wù)節(jié)點(diǎn)的情況下會怎么樣呢?
Raft協(xié)議就是保證多個(gè)服務(wù)器節(jié)點(diǎn)數(shù)據(jù)一致性的協(xié)議。
接下來我們看看Raft是怎么工作的。
Raft協(xié)議中,一個(gè)服務(wù)器的節(jié)點(diǎn)可以是以下三種狀態(tài)中的任意一個(gè):
Leader選舉
所有的節(jié)點(diǎn)都是從Follower狀態(tài)開始的。
如果Follower在一定的時(shí)間里面沒有收到選舉請求或者Leader節(jié)點(diǎn)的回復(fù),Follower則會轉(zhuǎn)變?yōu)镃andidate。
Candidate會發(fā)送選舉請求給所有的其他節(jié)點(diǎn),收到選舉請求的其他節(jié)點(diǎn)會反饋回Candidate,當(dāng)Candidate收到的所有響應(yīng)數(shù)目大于n/2 時(shí),Candidate會認(rèn)為絕大多數(shù)節(jié)點(diǎn)已經(jīng)選我作為Leader了,這時(shí)候Candidate就會轉(zhuǎn)變?yōu)長eader。接下來所有的數(shù)據(jù)變化都會經(jīng)由Leader發(fā)起。
日志復(fù)制流程
在Raft系統(tǒng)中,所有的數(shù)據(jù)變化都是以日志記錄的形式添加到服務(wù)節(jié)點(diǎn)之中。服務(wù)節(jié)點(diǎn)會不斷的讀取日志記錄,并將日志記錄更新到服務(wù)節(jié)點(diǎn)的數(shù)據(jù)中。日志記錄最開始的狀態(tài)是uncommited, 更新之后狀態(tài)則變?yōu)閏ommited.
為了實(shí)現(xiàn)所有服務(wù)節(jié)點(diǎn)的一致性更新,步驟如下:
term選舉周期
在Raft 協(xié)議中,有一個(gè)term的概念。term是一個(gè)選舉周期,一個(gè)term周期只會產(chǎn)生一個(gè)Leader,term連續(xù)遞增。
timeout
在Raft協(xié)議中,為了保證選舉和數(shù)據(jù)更新的順利進(jìn)行,規(guī)定了兩種類型的timeout:
選舉timeout和心跳timeout。
選舉和選舉timeout
每個(gè)term開始時(shí),會重置選舉timeout。在一個(gè)term中,Follower會等待timeout的時(shí)間,如果超出這個(gè)時(shí)間還沒有得到其他節(jié)點(diǎn)的選舉請求,Follower會主動轉(zhuǎn)變?yōu)镃andidate,并且term+1,意味著開啟了新的選舉周期。
選舉timeout是150ms-300ms之間的一個(gè)隨機(jī)數(shù),之所以隨機(jī)產(chǎn)生timeout,是為了避免同時(shí)產(chǎn)生多個(gè)Candidate的情況。
當(dāng)Follower轉(zhuǎn)變?yōu)镃andidate之后,term加1, 然后開始新一輪的選舉。Candidate首先會將自己的Vote Count 加1,然后發(fā)送請求選舉的消息給其他節(jié)點(diǎn)。
接收節(jié)點(diǎn)首先會比較term的大小,如果自己的term小于Candidate的term,則更新自己的term和Candidate的term保持一致,并重置timeout。如果接收節(jié)點(diǎn)在這個(gè)term中還沒有做任何選舉,則會返回選舉響應(yīng)消息給Candidate節(jié)點(diǎn)。
Candidate 節(jié)點(diǎn)收到大部分節(jié)點(diǎn)的選舉響應(yīng)之后,會變成Leader 節(jié)點(diǎn)。
一個(gè)選舉周期完成,接下來Leader 發(fā)送更新日志給Follower節(jié)點(diǎn),進(jìn)入日志更新階段。
選舉分裂
值得注意的是Candidate只有得到超出n/2個(gè)節(jié)點(diǎn)的選舉響應(yīng)才能變?yōu)長eader節(jié)點(diǎn)。如果兩個(gè)Follower節(jié)點(diǎn)同時(shí)變成Candidate節(jié)點(diǎn),則會產(chǎn)生選舉分裂的問題。
現(xiàn)在假設(shè)我們總共有4個(gè)節(jié)點(diǎn),其中兩個(gè)節(jié)點(diǎn)同時(shí)變成Candidate節(jié)點(diǎn),并向其余兩個(gè)節(jié)點(diǎn)發(fā)送選舉請求:
節(jié)點(diǎn)B,C成為Candidate節(jié)點(diǎn)并行向節(jié)點(diǎn)A,D發(fā)送選舉請求。
節(jié)點(diǎn)A,D分別響應(yīng)節(jié)點(diǎn)B,C的請求,這時(shí)候兩個(gè)Candidate節(jié)點(diǎn)由于得到的Vote都是2,不滿足大于n/2的條件,則其不能轉(zhuǎn)變?yōu)長eader節(jié)點(diǎn),繼續(xù)等待timeout至新的term開始并開啟新一輪的選舉,只到符合條件為止。
日志復(fù)制和心跳timeout
當(dāng)系統(tǒng)進(jìn)入到日志復(fù)制階段,Leader節(jié)點(diǎn)會以心跳timeout的節(jié)奏向Follower節(jié)點(diǎn)發(fā)送日志記錄,并且需要確保所有的節(jié)點(diǎn)都能夠接受到完整的日志記錄。
更多精彩內(nèi)容且看:
- 區(qū)塊鏈從入門到放棄系列教程-涵蓋密碼學(xué),超級賬本,以太坊,Libra,比特幣等持續(xù)更新
- Spring Boot 2.X系列教程:七天從無到有掌握Spring Boot-持續(xù)更新
- Spring 5.X系列教程:滿足你對Spring5的一切想象-持續(xù)更新
- java程序員從小工到專家成神之路(2020版)-持續(xù)更新中,附詳細(xì)文章教程
更多教程請參考flydean的博客
總結(jié)
以上是生活随笔為你收集整理的理解分布式一致性:Raft协议的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 理解zookeeper的一致性及缺点
- 下一篇: 理解分布式一致性:Paxos协议之Che