Redis 笔记(12)— 单线程架构(非阻塞 IO、多路复用)和多个异步线程
Redis 使用了單線程架構(gòu)、非阻塞 I/O 、多路復(fù)用模型來實現(xiàn)高性能的內(nèi)存數(shù)據(jù)庫服務(wù)。Redis 是單線程的。那么為什么說是單線程呢?
Redis 在 Reactor 模型內(nèi)開發(fā)了事件處理器,這個事件處理器分為多個 Socket(套接字)、IO 多路復(fù)用程序、事件分派器、事件處理器(連接應(yīng)答處理器、命令請求處理器、命令回復(fù)處理器),其中事件派發(fā)器的隊列是由單線程的事件處理器消費的,也是因為這個,Redis 才叫單線程模型。
當(dāng)多個事件并發(fā)出現(xiàn)時,I/O 多路復(fù)用程序?qū)⒈O(jiān)聽到的所有 Socket,關(guān)聯(lián)不同的事件處理器,這個關(guān)聯(lián)操作以有序(sequentially)、同步(synchronously)、每次一個套接字的方式向事件分派器傳送 Socket,當(dāng)上一個套接字產(chǎn)生的事件被處理完畢之后,I/O 多路復(fù)用程序才會繼續(xù)向事件分派器傳送下一個套接字。
1. 單線程模型
開啟三個 redis-cli 客戶端同時執(zhí)行命令。客戶端 1 設(shè)置一個字符串鍵值對:
127.0.0.1:6379> set hello world
客戶端 2 對 counter 做自增操作:
127.0.0.1:6379> incr counter
客戶端 3 對 counter 做自增操作:
127.0.0.1:6379> incr counter
Redis 客戶端與服務(wù)端的模型可以簡化成下圖,每次客戶端調(diào)用都經(jīng)歷了發(fā)送命令、執(zhí)行命令、返回結(jié)果三個過程。
其中第 2 步是重點要討論的,因為 Redis 是單線程來處理命令的,所以一條命令從客戶端達(dá)到服務(wù)端不會立刻被執(zhí)行,所有命令都會進(jìn)入一個隊列中,然后逐個被執(zhí)行。
所以上面 3 個客戶端命令的執(zhí)行順序是不確定的,如下圖所示。但是可以確定不會有兩條命令被同時執(zhí)行
所以兩條 incr 命令無論怎么執(zhí)行最終結(jié)果都是 2,不會產(chǎn)生并發(fā)問題,這就是 Redis 單線程的基本模型。
2. 非阻塞 IO
當(dāng)我們調(diào)用套接字的讀寫方法,默認(rèn)它們是阻塞的,比如 read 方法要傳遞進(jìn)去一個參數(shù) n,表示最多讀取這么多字節(jié)后再返回,如果一個字節(jié)都沒有,那么線程就會卡在那里,直到新的數(shù)據(jù)到來或者連接關(guān)閉了,read 方法才可以返回,線程才能繼續(xù)處理。而 write 方法一般來說不會阻塞,除非內(nèi)核為套接字分配的寫緩沖區(qū)已經(jīng)滿了,write 方法就會阻塞,直到緩存區(qū)中有空閑空間挪出來了。
非阻塞 IO 在套接字對象上提供了一個選項 Non_Blocking,當(dāng)這個選項打開時,讀寫方法不會阻塞,而是能讀多少讀多少,能寫多少寫多少。能讀多少取決于內(nèi)核為套接字分配的讀緩沖區(qū)內(nèi)部的數(shù)據(jù)字節(jié)數(shù),能寫多少取決于內(nèi)核為套接字分配的寫緩沖區(qū)的空閑空間字節(jié)數(shù)。讀方法和寫方法都會通過返回值來告知程序?qū)嶋H讀寫了多少字節(jié)。
有了非阻塞 IO 意味著線程在讀寫 IO 時可以不必再阻塞了,讀寫可以瞬間完成然后線程可以繼續(xù)干別的事了。
3. 多路復(fù)用(事件輪詢)
非阻塞 IO 有個問題,那就是線程要讀數(shù)據(jù),結(jié)果讀了一部分就返回了,線程如何知道何時才應(yīng)該繼續(xù)讀。也就是當(dāng)數(shù)據(jù)到來時,線程如何得到通知。寫也是一樣,如果緩沖區(qū)滿了,寫不完,剩下的數(shù)據(jù)何時才應(yīng)該繼續(xù)寫,線程也應(yīng)該得到通知。
事件輪詢 API 就是用來解決這個問題的,最簡單的事件輪詢 API 是 select 函數(shù),它是操作系統(tǒng)提供給用戶程序的 API。輸入是讀寫描述符列表 read_fds & write_fds,輸出是與之對應(yīng)的可讀可寫事件。同時還提供了一個 timeout 參數(shù),如果沒有任何事件到來,那么就最多等待 timeout 時間,線程處于阻塞狀態(tài)。一旦期間有任何事件到來,就可以立即返回。時間過了之后還是沒有任何事件到來,也會立即返回。拿到事件后,線程就可以繼續(xù)挨個處理相應(yīng)的事件。處理完了繼續(xù)過來輪詢。于是線程就進(jìn)入了一個死循環(huán),我們把這個死循環(huán)稱為事件循環(huán),一個循環(huán)為一個周期。
每個客戶端套接字 socket 都有對應(yīng)的讀寫文件描述符。
read_events, write_events = select(read_fds, write_fds, timeout)
for event in read_events:handle_read(event.fd)
for event in write_events:handle_write(event.fd)
handle_others() # 處理其它事情,如定時任務(wù)等
因為我們通過 select 系統(tǒng)調(diào)用同時處理多個通道描述符的讀寫事件,因此我們將這類系統(tǒng)調(diào)用稱為多路復(fù)用 API 。
現(xiàn)代操作系統(tǒng)的多路復(fù)用 API 已經(jīng)不再使用 select 系統(tǒng)調(diào)用,而改用 epoll(linux) 和 kqueue(freebsd & macosx),因為 select 系統(tǒng)調(diào)用的性能在描述符特別多時性能會非常差。它們使用起來可能在形式上略有差異,但是本質(zhì)上都是差不多的,都可以使用上面的偽代碼邏輯進(jìn)行理解。
服務(wù)器套接字 serversocket 對象的讀操作是指調(diào)用 accept 接受客戶端新連接。何時有新連接到來,也是通過 select 系統(tǒng)調(diào)用的讀事件來得到通知的。
4. 為什么單線程還能如此快
為什么 Redis 使用單線程模型會達(dá)到每秒萬級別的處理能力呢?可以將其歸結(jié)為三點:
- 純內(nèi)存訪問,
Redis將所有數(shù)據(jù)放在內(nèi)存中,內(nèi)存的響應(yīng)時長大約為 100 納秒,這是Redis達(dá)到每秒萬級別訪問的重要基礎(chǔ)。 - 非阻塞
I/O,Redis使用epoll作為I/O多路復(fù)用技術(shù)的實現(xiàn),再加上Redis自身的事件處理模型將epoll中的連接、讀寫、關(guān)閉都轉(zhuǎn)換為件,不在網(wǎng)絡(luò)I/O上浪費過多的時間。 - 單線程避免了線程切換和競態(tài)產(chǎn)生的消耗。
單線程能帶來幾個好處:
- 單線程可以簡化數(shù)據(jù)結(jié)構(gòu)和算法的實現(xiàn)。如果對高級編程語言熟悉的讀者應(yīng)該了解并發(fā)數(shù)據(jù)結(jié)構(gòu)實現(xiàn)不但困難而且開發(fā)測試比較麻煩。
- 單線程避免了線程切換和競態(tài)產(chǎn)生的消耗,對于服務(wù)端開發(fā)來說,鎖和線程切換通常是性能殺手。
但是單線程會有一個問題:對于每個命令的執(zhí)行時間是有要求的。如果某個命令執(zhí)行過長,會造成其他命令的阻塞,對于 Redis 這種高性能的服務(wù)來說是致命的,所以 Redis 是面向快速執(zhí)行場景的數(shù)據(jù)庫。
5. 多個異步線程
5.1 懶惰刪除
在 4.0 版本引入了 unlink 指令,它能對刪除操作進(jìn)行懶處理,丟給后臺線程來異步回收內(nèi)存。
> unlink key
OK
可以將整個 Redis 內(nèi)存里面所有有效的數(shù)據(jù)想象成一棵大樹。當(dāng) unlink 指令發(fā)出時,它只是把大樹中的一個樹枝別斷了,然后扔到旁邊的火堆里焚燒 (異步線程池)。樹枝離開大樹的一瞬間,它就再也無法被主線程中的其它指令訪問到了,因為主線程只會沿著這顆大樹來訪問。
Redis 提供了 flushdb 和 flushall 指令,用來清空數(shù)據(jù)庫,這也是極其緩慢的操作。Redis 4.0 同樣給這兩個指令也帶來了異步化,在指令后面增加 async 參數(shù)就可以將整棵大樹連根拔起,扔給后臺線程慢慢焚燒。
> flushall async
OK
5.2 異步隊列
主線程將對象的引用從「大樹」中摘除后,會將這個 key 的內(nèi)存回收操作包裝成一個任務(wù),塞進(jìn)異步任務(wù)隊列,后臺線程會從這個異步隊列中取任務(wù)。任務(wù)隊列被主線程和異步線程同時操作,所以必須是一個線程安全的隊列。
不是所有的 unlink 操作都會延后處理,如果對應(yīng) key 所占用的內(nèi)存很小,延后處理就沒有必要了,這時候 Redis 會將對應(yīng)的 key 內(nèi)存立即回收,跟 del 指令一樣。
5.3 其它異步刪除點
Redis 回收內(nèi)存除了 del 指令和 flush 之外,還會存在于在 key 的過期、LRU 淘汰、rename 指令以及從庫全量同步時接受完 rdb 文件后會立即進(jìn)行的 flush 操作。
Redis4.0 為這些刪除點也帶來了異步刪除機(jī)制,打開這些點需要額外的配置選項。
slave-lazy-flush從庫接受完rdb文件后的flush操作lazyfree-lazy-eviction內(nèi)存達(dá)到maxmemory時進(jìn)行淘汰lazyfree-lazy-expire key過期刪除lazyfree-lazy-server-del rename指令刪除 destKey
參考:
- 《Redis 開發(fā)運維》
- https://juejin.cn/book/6844733724618129422/section/6844733724710420487
總結(jié)
以上是生活随笔為你收集整理的Redis 笔记(12)— 单线程架构(非阻塞 IO、多路复用)和多个异步线程的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 2022-2028年中国床上用品行业投资
- 下一篇: 2022-2028年中国电动牙刷行业深度