硬核Redis总结,看这篇就够了!
高清思維導圖已同步Git:https://github.com/SoWhat1412/xmindfile
總感覺哪里不對,但是又說不上來1、基本類型及底層實現(xiàn)
1.1、String
用途:
適用于簡單key-value存儲、setnx key value實現(xiàn)分布式鎖、計數(shù)器(原子性)、分布式全局唯一ID。
底層:C語言中String用char[]數(shù)組表示,源碼中用SDS(simple dynamic string)封裝char[],這是是Redis存儲的最小單元,一個SDS最大可以存儲512M信息。
struct?sdshdr{unsigned?int?len;?//?標記char[]的長度unsigned?int?free;?//標記char[]中未使用的元素個數(shù)char?buf[];?//?存放元素的坑 }Redis對SDS再次封裝生成了RedisObject,核心有兩個作用:
說明是5種類型哪一種。
里面有指針用來指向 SDS。
當你執(zhí)行set name sowhat的時候,其實Redis會創(chuàng)建兩個RedisObject對象,鍵的RedisObject 和 值的RedisOjbect 其中它們type = REDIS_STRING,而SDS分別存儲的就是 name 跟 sowhat 字符串咯。
并且Redis底層對SDS有如下優(yōu)化:
SDS修改后大小 > 1M時 系統(tǒng)會多分配空間來進行空間預分配。
SDS是惰性釋放空間的,你free了空間,可是系統(tǒng)把數(shù)據(jù)記錄下來下次想用時候可直接使用。不用新申請空間。
1.2、List
查看源碼底層 adlist.h 會發(fā)現(xiàn)底層就是個 雙端鏈表,該鏈表最大長度為2^32-1。常用就這幾個組合。
lpush + lpop = stack 先進后出的棧?
lpush + rpop = queue 先進先出的隊列?
lpush + ltrim = capped collection 有限集合
lpush + brpop = message queue 消息隊列
一般可以用來做簡單的消息隊列,并且當數(shù)據(jù)量小的時候可能用到獨有的壓縮列表來提升性能。當然專業(yè)點還是要 RabbitMQ、ActiveMQ等
1.3、Hash
散列非常適用于將一些相關(guān)的數(shù)據(jù)存儲在一起,比如用戶的購物車。該類型在日常用途還是挺多的。
這里需要明確一點:Redis中只有一個K,一個V。其中 K 絕對是字符串對象,而 V 可以是String、List、Hash、Set、ZSet任意一種。
hash的底層主要是采用字典dict的結(jié)構(gòu),整體呈現(xiàn)層層封裝。從小到大如下:
1.3.1、dictEntry
真正的數(shù)據(jù)節(jié)點,包括key、value 和 next 節(jié)點。
1.3.2、dictht
1、數(shù)據(jù) dictEntry 類型的數(shù)組,每個數(shù)組的item可能都指向一個鏈表。
2、數(shù)組長度 size。
3、sizemask 等于 size - 1。
4、當前 dictEntry 數(shù)組中包含總共多少節(jié)點。
1.3.3、dict
1、dictType 類型,包括一些自定義函數(shù),這些函數(shù)使得key和value能夠存儲
2、rehashidx 其實是一個標志量,如果為-1說明當前沒有擴容,如果不為 -1 則記錄擴容位置。
3、dictht數(shù)組,兩個Hash表。
4、iterators 記錄了當前字典正在進行中的迭代器
組合后結(jié)構(gòu)就是如下:
1.3.4、漸進式擴容
為什么 dictht ht[2]是兩個呢?目的是在擴容的同時不影響前端的CURD,慢慢的把數(shù)據(jù)從ht[0]轉(zhuǎn)移到ht[1]中,同時rehashindex來記錄轉(zhuǎn)移的情況,當全部轉(zhuǎn)移完成,將ht[1]改成ht[0]使用。
rehashidx = -1說明當前沒有擴容,rehashidx != -1則表示擴容到數(shù)組中的第幾個了。
擴容之后的數(shù)組大小為大于used*2的2的n次方的最小值,跟 HashMap 類似。然后挨個遍歷數(shù)組同時調(diào)整rehashidx的值,對每個dictEntry[i] 再挨個遍歷鏈表將數(shù)據(jù) Hash 后重新映射到 dictht[1]里面。并且 dictht[0].use 跟 dictht[1].use 是動態(tài)變化的。
整個過程的重點在于rehashidx,其為第一個數(shù)組正在移動的下標位置,如果當前內(nèi)存不夠,或者操作系統(tǒng)繁忙,擴容的過程可以隨時停止。
停止之后如果對該對象進行操作,那是什么樣子的呢?
1、如果是新增,則直接新增后第二個數(shù)組,因為如果新增到第一個數(shù)組,以后還是要移過來,沒必要浪費時間
2、如果是刪除,更新,查詢,則先查找第一個數(shù)組,如果沒找到,則再查詢第二個數(shù)組。
1.4、Set
如果你明白Java中HashSet是HashMap的簡化版那么這個Set應該也理解了。都是一樣的套路而已。這里你可以認為是沒有Value的Dict。看源碼 t.set.c 就可以了解本質(zhì)了。
int?setTypeAdd(robj?*subject,?robj?*value)?{long?long?llval;if?(subject->encoding?==?REDIS_ENCODING_HT)?{//?看到底層調(diào)用的還是dictAdd,只不過第三個參數(shù)=?NULLif?(dictAdd(subject->ptr,value,NULL)?==?DICT_OK)?{incrRefCount(value);return?1;}....1.5、ZSet
范圍查找 的天敵就是 有序集合,看底層 redis.h 后就會發(fā)現(xiàn) Zset用的就是可以跟二叉樹媲美的跳躍表來實現(xiàn)有序。跳表就是多層鏈表的結(jié)合體,跳表分為許多層(level),每一層都可以看作是數(shù)據(jù)的索引,這些索引的意義就是加快跳表查找數(shù)據(jù)速度。
每一層的數(shù)據(jù)都是有序的,上一層數(shù)據(jù)是下一層數(shù)據(jù)的子集,并且第一層(level 1)包含了全部的數(shù)據(jù);層次越高,跳躍性越大,包含的數(shù)據(jù)越少。并且隨便插入一個數(shù)據(jù)該數(shù)據(jù)是否會是跳表索引完全隨機的跟玩骰子一樣。
跳表包含一個表頭,它查找數(shù)據(jù)時,是從上往下,從左往右進行查找。現(xiàn)在找出值為37的節(jié)點為例,來對比說明跳表和普遍的鏈表。
沒有跳表查詢 比如我查詢數(shù)據(jù)37,如果沒有上面的索引時候路線如下圖:
有跳表查詢 有跳表查詢37的時候路線如下圖:應用場景:
積分排行榜、時間排序新聞、延時隊列。
1.6、Redis Geo
以前寫過Redis Geo核心原理解析,想看的直接跳轉(zhuǎn)即可。他的核心思想就是將地球近似為球體來看待,然后 GEO利用 GeoHash 將二維的經(jīng)緯度轉(zhuǎn)換成字符串,來實現(xiàn)位置的劃分跟指定距離的查詢。
1.7、HyperLogLog
HyperLogLog :是一種概率數(shù)據(jù)結(jié)構(gòu),它使用概率算法來統(tǒng)計集合的近似基數(shù)。而它算法的最本源則是伯努利過程 + 分桶 + 調(diào)和平均數(shù)。具體實現(xiàn)可看 ?HyperLogLog 講解。
功能:誤差允許范圍內(nèi)做基數(shù)統(tǒng)計 (基數(shù)就是指一個集合中不同值的個數(shù)) 的時候非常有用,每個HyperLogLog的鍵可以計算接近2^64不同元素的基數(shù),而大小只需要12KB。錯誤率大概在0.81%。所以如果用做 UV 統(tǒng)計很合適。
HyperLogLog底層 一共分了 2^14 個桶,也就是 16384 個桶。每個(registers)桶中是一個 6 bit 的數(shù)組,這里有個騷操作就是一般人可能直接用一個字節(jié)當桶浪費2個bit空間,但是Redis底層只用6個然后通過前后拼接實現(xiàn)對內(nèi)存用到了極致,最終就是 16384*6/8/1024 = 12KB。
1.8、bitmap
BitMap 原本的含義是用一個比特位來映射某個元素的狀態(tài)。由于一個比特位只能表示 0 和 1 兩種狀態(tài),所以 BitMap 能映射的狀態(tài)有限,但是使用比特位的優(yōu)勢是能大量的節(jié)省內(nèi)存空間。
在 Redis 中BitMap 底層是基于字符串類型實現(xiàn)的,可以把 Bitmaps 想象成一個以比特位為單位的數(shù)組,數(shù)組的每個單元只能存儲0和1,數(shù)組的下標在 Bitmaps 中叫做偏移量,BitMap 的 offset 值上限 2^32 - 1。
用戶簽到
key = 年份:用戶id ?offset = (今天是一年中的第幾天) % (今年的天數(shù))
統(tǒng)計活躍用戶
使用日期作為 key,然后用戶 id 為 offset 設(shè)置不同offset為0 1 即可。
PS : Redis 它的通訊協(xié)議是基于TCP的應用層協(xié)議 RESP(REdis Serialization Protocol)。
1.9、Bloom Filter
使用布隆過濾器得到的判斷結(jié)果:不存在的一定不存在,存在的不一定存在。
布隆過濾器 原理:
當一個元素被加入集合時,通過K個散列函數(shù)將這個元素映射成一個位數(shù)組中的K個點(有效降低沖突概率),把它們置為1。檢索時,我們只要看看這些點是不是都是1就知道集合中有沒有它了:如果這些點有任何一個為0,則被檢元素一定不在;如果都是1,則被檢元素很可能在。這就是布隆過濾器的基本思想。
想玩的話可以用Google的guava包玩耍一番。
1.10 發(fā)布訂閱
redis提供了發(fā)布、訂閱模式的消息機制,其中消息訂閱者與發(fā)布者不直接通信,發(fā)布者向指定的頻道(channel)發(fā)布消息,訂閱該頻道的每個客戶端都可以接收到消息。不過比專業(yè)的MQ(RabbitMQ RocketMQ ActiveMQ Kafka)相比不值一提,這個功能就算球了。
2、持久化
因為Redis數(shù)據(jù)在內(nèi)存,斷電既丟,因此持久化到磁盤是必須得有的,Redis提供了RDB跟AOF兩種模式。
2.1、RDB
RDB 持久化機制,是對 Redis 中的數(shù)據(jù)執(zhí)行周期性的持久化。更適合做冷備。優(yōu)點:
1、壓縮后的二進制文,適用于備份、全量復制,用于災難恢復加載RDB恢復數(shù)據(jù)遠快于AOF方式,適合大規(guī)模的數(shù)據(jù)恢復。
2、如果業(yè)務對數(shù)據(jù)完整性和一致性要求不高,RDB是很好的選擇。數(shù)據(jù)恢復比AOF快。
缺點:
1、RDB是周期間隔性的快照文件,數(shù)據(jù)的完整性和一致性不高,因為RDB可能在最后一次備份時宕機了。
2、備份時占用內(nèi)存,因為Redis 在備份時會獨立fork一個子進程,將數(shù)據(jù)寫入到一個臨時文件(此時內(nèi)存中的數(shù)據(jù)是原來的兩倍哦),最后再將臨時文件替換之前的備份文件。所以要考慮到大概兩倍的數(shù)據(jù)膨脹性。
注意手動觸發(fā)及COW:
1、SAVE 直接調(diào)用 rdbSave ,阻塞 Redis 主進程,導致無法提供服務。2、BGSAVE 則 fork 出一個子進程,子進程負責調(diào)用 rdbSave ,在保存完成后向主進程發(fā)送信號告知完成。在BGSAVE 執(zhí)行期間仍可以繼續(xù)處理客戶端的請求。
3、Copy On Write 機制,備份的是開始那個時刻內(nèi)存中的數(shù)據(jù),只復制被修改內(nèi)存頁數(shù)據(jù),不是全部內(nèi)存數(shù)據(jù)。
4、Copy On Write 時如果父子進程大量寫操作會導致分頁錯誤。
2.2、AOF
AOF 機制對每條寫入命令作為日志,以 append-only 的模式寫入一個日志文件中,因為這個模式是只追加的方式,所以沒有任何磁盤尋址的開銷,所以很快,有點像 Mysql 中的binlog。AOF更適合做熱備。
優(yōu)點:
AOF是一秒一次去通過一個后臺的線程fsync操作,數(shù)據(jù)丟失不用怕。
缺點:
1、對于相同數(shù)量的數(shù)據(jù)集而言,AOF文件通常要大于RDB文件。RDB 在恢復大數(shù)據(jù)集時的速度比 AOF 的恢復速度要快。
2、根據(jù)同步策略的不同,AOF在運行效率上往往會慢于RDB。總之,每秒同步策略的效率是比較高的。
AOF整個流程分兩步:第一步是命令的實時寫入,不同級別可能有1秒數(shù)據(jù)損失。命令先追加到aof_buf然后再同步到AO磁盤,如果實時寫入磁盤會帶來非常高的磁盤IO,影響整體性能。
第二步是對aof文件的重寫,目的是為了減少AOF文件的大小,可以自動觸發(fā)或者手動觸發(fā)(BGREWRITEAOF),是Fork出子進程操作,期間Redis服務仍可用。
1、在重寫期間,由于主進程依然在響應命令,為了保證最終備份的完整性;它依然會寫入舊的AOF中,如果重寫失敗,能夠保證數(shù)據(jù)不丟失。
2、為了把重寫期間響應的寫入信息也寫入到新的文件中,因此也會為子進程保留一個buf,防止新寫的file丟失數(shù)據(jù)。
3、重寫是直接把當前內(nèi)存的數(shù)據(jù)生成對應命令,并不需要讀取老的AOF文件進行分析、命令合并。
4、無論是 RDB 還是 AOF 都是先寫入一個臨時文件,然后通過rename完成文件的替換工作。
關(guān)于Fork的建議:
1、降低fork的頻率,比如可以手動來觸發(fā)RDB生成快照、與AOF重寫;
2、控制Redis最大使用內(nèi)存,防止fork耗時過長;
3、配置牛逼點,合理配置Linux的內(nèi)存分配策略,避免因為物理內(nèi)存不足導致fork失敗。
4、Redis在執(zhí)行BGSAVE和BGREWRITEAOF命令時,哈希表的負載因子>=5,而未執(zhí)行這兩個命令時>=1。目的是盡量減少寫操作,避免不必要的內(nèi)存寫入操作。
5、哈希表的擴展因子:哈希表已保存節(jié)點數(shù)量 / 哈希表大小。因子決定了是否擴展哈希表。
2.3、恢復
啟動時會先檢查AOF(數(shù)據(jù)更完整)文件是否存在,如果不存在就嘗試加載RDB。
2.4、建議
既然單獨用RDB會丟失很多數(shù)據(jù)。單獨用AOF,數(shù)據(jù)恢復沒RDB來的快,所以出現(xiàn)問題了第一時間用RDB恢復,然后AOF做數(shù)據(jù)補全才說王道。
3、Redis為什么那么快
3.1、 基于內(nèi)存實現(xiàn):
數(shù)據(jù)都存儲在內(nèi)存里,相比磁盤IO操作快百倍,操作速率很快。
3.2、高效的數(shù)據(jù)結(jié)構(gòu):
Redis底層多種數(shù)據(jù)結(jié)構(gòu)支持不同的數(shù)據(jù)類型,比如HyperLogLog它連2個字節(jié)都不想浪費。
3.3、豐富而合理的編碼:
Redis底層提供了 豐富而合理的編碼 ?,五種數(shù)據(jù)類型根據(jù)長度及元素的個數(shù)適配不同的編碼格式。
1、String:自動存儲int類型,非int類型用raw編碼。
2、List:字符串長度且元素個數(shù)小于一定范圍使用 ziplist 編碼,否則轉(zhuǎn)化為 linkedlist 編碼。
3、Hash:hash 對象保存的鍵值對內(nèi)的鍵和值字符串長度小于一定值及鍵值對。
4、Set:保存元素為整數(shù)及元素個數(shù)小于一定范圍使用 intset 編碼,任意條件不滿足,則使用 hashtable 編碼。
5、Zset:保存的元素個數(shù)小于定值且成員長度小于定值使用 ziplist 編碼,任意條件不滿足,則使用 skiplist 編碼。
3.4、合適的線程模型:
I/O 多路復用模型同時監(jiān)聽客戶端連接,多線程是需要上下文切換的,對于內(nèi)存數(shù)據(jù)庫來說這點很致命。
3.5、 Redis6.0后引入多線程提速:
要知道 讀寫網(wǎng)絡的read/write系統(tǒng)耗時 >> Redis運行執(zhí)行耗時,Redis的瓶頸主要在于網(wǎng)絡的 IO 消耗, 優(yōu)化主要有兩個方向:
1、提高網(wǎng)絡 IO 性能,典型的實現(xiàn)比如使用 DPDK 來替代內(nèi)核網(wǎng)絡棧的方式?
2、使用多線程充分利用多核,典型的實現(xiàn)比如 Memcached。
協(xié)議棧優(yōu)化的這種方式跟 Redis 關(guān)系不大,支持多線程是一種最有效最便捷的操作方式。所以Redis支持多線程主要就是兩個原因:
1、可以充分利用服務器 CPU 資源,目前主線程只能利用一個核
2、多線程任務可以分攤 Redis 同步 IO 讀寫負荷
關(guān)于多線程須知:
Redis 6.0 版本 默認多線程是關(guān)閉的 io-threads-do-reads no
Redis 6.0 版本 開啟多線程后 線程數(shù)也要 謹慎設(shè)置。
多線程可以使得性能翻倍,但是多線程只是用來處理網(wǎng)絡數(shù)據(jù)的讀寫和協(xié)議解析,執(zhí)行命令仍然是單線程順序執(zhí)行。
4、常見問題
4.1、緩存雪崩
雪崩定義:
Redis中大批量key在同一時間同時失效導致所有請求都打到了MySQL。而MySQL扛不住導致大面積崩塌。
雪崩解決方案:
1、緩存數(shù)據(jù)的過期時間加上個隨機值,防止同一時間大量數(shù)據(jù)過期現(xiàn)象發(fā)生。
2、如果緩存數(shù)據(jù)庫是分布式部署,將熱點數(shù)據(jù)均勻分布在不同搞得緩存數(shù)據(jù)庫中。
3、設(shè)置熱點數(shù)據(jù)永遠不過期。
4.2、緩存穿透
穿透定義:
緩存穿透 是 指緩存和數(shù)據(jù)庫中都沒有的數(shù)據(jù),比如ID默認>0,黑客一直 請求ID= -12的數(shù)據(jù)那么就會導致數(shù)據(jù)庫壓力過大,嚴重會擊垮數(shù)據(jù)庫。
穿透解決方案:
1、后端接口層增加 用戶鑒權(quán)校驗,參數(shù)做校驗等。
2、單個IP每秒訪問次數(shù)超過閾值直接拉黑IP,關(guān)進小黑屋1天,在獲取IP代理池的時候我就被拉黑過。
3、從緩存取不到的數(shù)據(jù),在數(shù)據(jù)庫中也沒有取到,這時也可以將key-value對寫為key-null 失效時間可以為15秒防止惡意攻擊。
4、用Redis提供的 ?Bloom Filter 特性也OK。
4.3、緩存擊穿
擊穿定義:
現(xiàn)象:大并發(fā)集中對這一個熱點key進行訪問,當這個Key在失效的瞬間,持續(xù)的大并發(fā)就穿破緩存,直接請求數(shù)據(jù)庫。
擊穿解決:
設(shè)置熱點數(shù)據(jù)永遠不過期 加上互斥鎖也能搞定了
4.4、雙寫一致性
雙寫:緩存跟數(shù)據(jù)庫均更新數(shù)據(jù),如何保證數(shù)據(jù)一致性?
1、先更新數(shù)據(jù)庫,再更新緩存
安全問題:線程A更新數(shù)據(jù)庫->線程B更新數(shù)據(jù)庫->線程B更新緩存->線程A更新緩存。導致臟讀。
業(yè)務場景:讀多寫少場景,頻繁更新數(shù)據(jù)庫而緩存根本沒用。更何況如果緩存是疊加計算后結(jié)果更浪費性能。
2、先刪緩存,再更新數(shù)據(jù)庫
A 請求寫來更新緩存。
B 發(fā)現(xiàn)緩存不在去數(shù)據(jù)查詢舊值后寫入緩存。
A 將數(shù)據(jù)寫入數(shù)據(jù)庫,此時緩存跟數(shù)據(jù)庫不一致。
因此 FackBook 提出了 ?Cache Aside Pattern
失效:應用程序先從cache取數(shù)據(jù),沒有得到,則從數(shù)據(jù)庫中取數(shù)據(jù),成功后,放到緩存中。
命中:應用程序從cache中取數(shù)據(jù),取到后返回。
更新:先把數(shù)據(jù)存到數(shù)據(jù)庫中,成功后,再讓緩存失效。
4.5、腦裂
腦裂是指因為網(wǎng)絡原因,導致master節(jié)點、slave節(jié)點 和 sentinel集群處于不用的網(wǎng)絡分區(qū),此時因為sentinel集群無法感知到master的存在,所以將slave節(jié)點提升為master節(jié)點 此時存在兩個不同的master節(jié)點就像一個大腦分裂成了兩個。其實在Hadoop 、Spark集群中都會出現(xiàn)這樣的情況,只是解決方法不同而已(用ZK配合強制殺死)。
集群腦裂問題中,如果客戶端還在基于原來的master節(jié)點繼續(xù)寫入數(shù)據(jù)那么新的master節(jié)點將無法同步這些數(shù)據(jù),當網(wǎng)絡問題解決后sentinel集群將原先的master節(jié)點降為slave節(jié)點,此時再從新的master中同步數(shù)據(jù)將造成大量的數(shù)據(jù)丟失。
Redis處理方案是redis的配置文件中存在兩個參數(shù)
min-replicas-to-write?3??表示連接到master的最少slave數(shù)量 min-replicas-max-lag?10??表示slave連接到master的最大延遲時間如果連接到master的slave數(shù)量 < 第一個參數(shù) 且 ping的延遲時間 <= 第二個參數(shù)那么master就會拒絕寫請求,配置了這兩個參數(shù)后如果發(fā)生了集群腦裂則原先的master節(jié)點接收到客戶端的寫入請求會拒絕就可以減少數(shù)據(jù)同步之后的數(shù)據(jù)丟失。
4.6、事務
MySQL?中的事務還是挺多道道的還要,而在Redis中的事務只要有如下三步:關(guān)于事務具體結(jié)論:
1、redis事務就是一次性、順序性、排他性的執(zhí)行一個隊列中的一系列命令。 ?
2、Redis事務沒有隔離級別的概念:批量操作在發(fā)送 EXEC 命令前被放入隊列緩存,并不會被實際執(zhí)行,也就不存在事務內(nèi)的查詢要看到事務里的更新,事務外查詢不能看到。
3、Redis不保證原子性:Redis中單條命令是原子性執(zhí)行的,但事務不保證原子性。
4、Redis編譯型錯誤事務中所有代碼均不執(zhí)行,指令使用錯誤。運行時異常是錯誤命令導致異常,其他命令可正常執(zhí)行。
5、watch指令類似于樂觀鎖,在事務提交時,如果watch監(jiān)控的多個KEY中任何KEY的值已經(jīng)被其他客戶端更改,則使用EXEC執(zhí)行事務時,事務隊列將不會被執(zhí)行。
4.7、正確開發(fā)步驟
上線前:Redis 高可用,主從+哨兵,Redis cluster,避免全盤崩潰。
上線時:本地 ehcache 緩存 + Hystrix 限流 + 降級,避免MySQL扛不住。上線后:Redis 持久化采用 RDB + AOF 來保證斷點后自動從磁盤上加載數(shù)據(jù),快速恢復緩存數(shù)據(jù)。
5、分布式鎖
日常開發(fā)中我們可以用 synchronized 、Lock ?實現(xiàn)并發(fā)編程。但是Java中的鎖只能保證在同一個JVM進程內(nèi)中執(zhí)行。如果在分布式集群環(huán)境下用鎖呢?日常一般有兩種選擇方案。
5.1、 Zookeeper實現(xiàn)分布式鎖
你需要知道一點基本zookeeper知識:
1、持久節(jié)點:客戶端斷開連接zk不刪除persistent類型節(jié)點 2、臨時節(jié)點:客戶端斷開連接zk刪除ephemeral類型節(jié)點 3、順序節(jié)點:節(jié)點后面會自動生成類似0000001的數(shù)字表示順序 4、節(jié)點變化的通知:客戶端注冊了監(jiān)聽節(jié)點變化的時候,會調(diào)用回調(diào)方法
大致流程如下,其中注意每個節(jié)點只監(jiān)控它前面那個節(jié)點狀態(tài),從而避免羊群效應。關(guān)于模板代碼百度即可。缺點:
頻繁的創(chuàng)建刪除節(jié)點,加上注冊watch事件,對于zookeeper集群的壓力比較大,性能也比不上Redis實現(xiàn)的分布式鎖。
5.2、 Redis實現(xiàn)分布式鎖
本身原理也比較簡單,Redis 自身就是一個單線程處理器,具備互斥的特性,通過setNX,exist等命令就可以完成簡單的分布式鎖,處理好超時釋放鎖的邏輯即可。
SETNX
SETNX 是SET if Not eXists的簡寫,日常指令是SETNX key value,如果 key 不存在則set成功返回 1,如果這個key已經(jīng)存在了返回0。
SETEX
SETEX key seconds value 表達的意思是 將值 value 關(guān)聯(lián)到 key ,并將 key 的生存時間設(shè)為多少秒。如果 key 已經(jīng)存在,setex命令將覆寫舊值。并且 setex是一個原子性(atomic)操作。
加鎖:
一般就是用一個標識唯一性的字符串比如UUID 配合 SETNX 實現(xiàn)加鎖。
解鎖:
這里用到了LUA腳本,LUA可以保證是原子性的,思路就是判斷一下Key和入?yún)⑹欠裣嗟?#xff0c;是的話就刪除,返回成功1,0就是失敗。
缺點:
這個鎖是無法重入的,且自己實心的話各種邊邊角角都要考慮到,所以了解個大致思路流程即可,工程化還是用開源工具包就行。
5.3、 Redisson實現(xiàn)分布式鎖
Redisson 是在Redis基礎(chǔ)上的一個服務,采用了基于NIO的Netty框架,不僅能作為Redis底層驅(qū)動客戶端,還能將原生的RedisHash,List,Set,String,Geo,HyperLogLog等數(shù)據(jù)結(jié)構(gòu)封裝為Java里大家最熟悉的映射(Map),列表(List),集(Set),通用對象桶(Object Bucket),地理空間對象桶(Geospatial Bucket),基數(shù)估計算法(HyperLogLog)等結(jié)構(gòu)。
這里我們只是用到了關(guān)于分布式鎖的幾個指令,他的大致底層原理:
Redisson加鎖解鎖 大致流程圖如下:
6、Redis 過期策略和內(nèi)存淘汰策略
6.1、Redis的過期策略
Redis中 過期策略 通常有以下三種:
1、定時過期:
每個設(shè)置過期時間的key都需要創(chuàng)建一個定時器,到過期時間就會立即對key進行清除。該策略可以立即清除過期的數(shù)據(jù),對內(nèi)存很友好;但是會占用大量的CPU資源去處理過期的數(shù)據(jù),從而影響緩存的響應時間和吞吐量。
2、惰性過期:
只有當訪問一個key時,才會判斷該key是否已過期,過期則清除。該策略可以最大化地節(jié)省CPU資源,卻對內(nèi)存非常不友好。極端情況可能出現(xiàn)大量的過期key沒有再次被訪問,從而不會被清除,占用大量內(nèi)存。
3、定期過期:
每隔一定的時間,會掃描一定數(shù)量的數(shù)據(jù)庫的expires字典中一定數(shù)量的key,并清除其中已過期的key。該策略是前兩者的一個折中方案。通過調(diào)整定時掃描的時間間隔和每次掃描的限定耗時,可以在不同情況下使得CPU和內(nèi)存資源達到最優(yōu)的平衡效果。
expires字典會保存所有設(shè)置了過期時間的key的過期時間數(shù)據(jù),其中 key 是指向鍵空間中的某個鍵的指針,value是該鍵的毫秒精度的UNIX時間戳表示的過期時間。鍵空間是指該Redis集群中保存的所有鍵。
Redis采用的過期策略:惰性刪除 + 定期刪除。memcached采用的過期策略:惰性刪除。
6.2、6種內(nèi)存淘汰策略
Redis的內(nèi)存淘汰策略是指在Redis的用于緩存的內(nèi)存不足時,怎么處理需要新寫入且需要申請額外空間的數(shù)據(jù)。
1、volatile-lru:從已設(shè)置過期時間的數(shù)據(jù)集(server.db[i].expires)中挑選最近最少使用的數(shù)據(jù)淘汰?
2、volatile-ttl:從已設(shè)置過期時間的數(shù)據(jù)集(server.db[i].expires)中挑選將要過期的數(shù)據(jù)淘汰?
3、volatile-random:從已設(shè)置過期時間的數(shù)據(jù)集(server.db[i].expires)中任意選擇數(shù)據(jù)淘汰?
4、allkeys-lru:從數(shù)據(jù)集(server.db[i].dict)中挑選最近最少使用的數(shù)據(jù)淘汰?
5、allkeys-random:從數(shù)據(jù)集(server.db[i].dict)中任意選擇數(shù)據(jù)淘汰 6、no-enviction(驅(qū)逐):禁止驅(qū)逐數(shù)據(jù),不刪除的意思。
面試常問常考的也就是LRU了,大家熟悉的LinkedHashMap中也實現(xiàn)了LRU算法的,實現(xiàn)如下:
class?SelfLRUCache<K,?V>?extends?LinkedHashMap<K,?V>?{private?final?int?CACHE_SIZE;/***?傳遞進來最多能緩存多少數(shù)據(jù)*?@param?cacheSize?緩存大小*/public?SelfLRUCache(int?cacheSize)?{// true 表示讓 linkedHashMap 按照訪問順序來進行排序,最近訪問的放在頭部,最老訪問的放在尾部。super((int)?Math.ceil(cacheSize?/?0.75)?+?1,?0.75f,?true);CACHE_SIZE?=?cacheSize;}@Overrideprotected?boolean?removeEldestEntry(Map.Entry<K,?V>?eldest)?{//?當 map中的數(shù)據(jù)量大于指定的緩存?zhèn)€數(shù)的時候,就自動刪除最老的數(shù)據(jù)。return?size()?>?CACHE_SIZE;} }6.2、總結(jié)
Redis的內(nèi)存淘汰策略的選取并不會影響過期的key的處理。內(nèi)存淘汰策略用于處理內(nèi)存不足時的需要申請額外空間的數(shù)據(jù),過期策略用于處理過期的緩存數(shù)據(jù)。
7、Redis 集群高可用
單機問題有機器故障、容量瓶頸、QPS瓶頸。在實際應用中,Redis的多機部署時候會涉及到redis主從復制、Sentinel哨兵模式、Redis Cluster。
| 單機版 | 架構(gòu)簡單,部署方便 | 機器故障、容量瓶頸、QPS瓶頸 |
| 主從復制 | 高可靠性,讀寫分離 | 故障恢復復雜,主庫的寫跟存受單機限制 |
| Sentinel 哨兵 | 集群部署簡單,HA | 原理繁瑣,slave存在資源浪費,不能解決讀寫分離問題 |
| Redis Cluster | 數(shù)據(jù)動態(tài)存儲solt,可擴展,高可用 | 客戶端動態(tài)感知后端變更,批量操作支持查 |
7.1、redis主從復制
該模式下 具有高可用性且讀寫分離, 會采用 增量同步 跟 全量同步 兩種機制。
7.1.1、全量同步
Redis全量復制一般發(fā)生在Slave初始化階段,這時Slave需要將Master上的所有數(shù)據(jù)都復制一份:
1、slave連接master,發(fā)送psync命令。
2、master接收到psync命名后,開始執(zhí)行bgsave命令生成RDB文件并使用緩沖區(qū)記錄此后執(zhí)行的所有寫命令。
3、master發(fā)送快照文件到slave,并在發(fā)送期間繼續(xù)記錄被執(zhí)行的寫命令。4、slave收到快照文件后丟棄所有舊數(shù)據(jù),載入收到的快照。
5、master快照發(fā)送完畢后開始向slave發(fā)送緩沖區(qū)中的寫命令。
6、slave完成對快照的載入,開始接收命令請求,并執(zhí)行來自master緩沖區(qū)的寫命令。
7.1.2、增量同步
也叫指令同步,就是從庫重放在主庫中進行的指令。Redis會把指令存放在一個環(huán)形隊列當中,因為內(nèi)存容量有限,如果備機一直起不來,不可能把所有的內(nèi)存都去存指令,也就是說,如果備機一直未同步,指令可能會被覆蓋掉。
Redis增量復制是指Slave初始化后開始正常工作時master發(fā)生的寫操作同步到slave的過程。增量復制的過程主要是master每執(zhí)行一個寫命令就會向slave發(fā)送相同的寫命令。
7.1.3、Redis主從同步策略:
1、主從剛剛連接的時候,進行全量同步;全同步結(jié)束后,進行增量同步。當然,如果有需要,slave 在任何時候都可以發(fā)起全量同步。redis 策略是,無論如何,首先會嘗試進行增量同步,如不成功,要求從機進行全量同步。2、slave在同步master數(shù)據(jù)時候如果slave丟失連接不用怕,slave在重新連接之后丟失重補。
3、一般通過主從來實現(xiàn)讀寫分離,但是如果master掛掉后如何保證Redis的 HA呢?引入Sentinel進行master的選擇。
7.2、高可用之哨兵模式
Redis-sentinel ?本身是一個獨立運行的進程,一般sentinel集群 節(jié)點數(shù)至少三個且奇數(shù)個,它能監(jiān)控多個master-slave集群,sentinel節(jié)點發(fā)現(xiàn)master宕機后能進行自動切換。Sentinel可以監(jiān)視任意多個主服務器以及主服務器屬下的從服務器,并在被監(jiān)視的主服務器下線時,自動執(zhí)行故障轉(zhuǎn)移操作。這里需注意sentinel也有single-point-of-failure問題。大致羅列下哨兵用途:
集群監(jiān)控:循環(huán)監(jiān)控master跟slave節(jié)點。
消息通知:當它發(fā)現(xiàn)有redis實例有故障的話,就會發(fā)送消息給管理員?
故障轉(zhuǎn)移:這里分為主觀下線(單獨一個哨兵發(fā)現(xiàn)master故障了)。客觀下線(多個哨兵進行抉擇發(fā)現(xiàn)達到quorum數(shù)時候開始進行切換)。
配置中心:如果發(fā)生了故障轉(zhuǎn)移,它會通知將master的新地址寫在配置中心告訴客戶端。
7.3、Redis Cluster
RedisCluster是Redis的分布式解決方案,在3.0版本后推出的方案,有效地解決了Redis分布式的需求。
7.3.1、分區(qū)規(guī)則
常見的分區(qū)規(guī)則
節(jié)點取余:hash(key) % N
一致性哈希:一致性哈希環(huán)
虛擬槽哈希:CRC16[key] & 16383
RedisCluster采用了虛擬槽分區(qū)方式,具題的實現(xiàn)細節(jié)如下:
1、采用去中心化的思想,它使用虛擬槽solt分區(qū)覆蓋到所有節(jié)點上,取數(shù)據(jù)一樣的流程,節(jié)點之間使用輕量協(xié)議通信Gossip來減少帶寬占用所以性能很高,?
2、自動實現(xiàn)負載均衡與高可用,自動實現(xiàn)failover并且支持動態(tài)擴展,官方已經(jīng)玩到可以1000個節(jié)點 實現(xiàn)的復雜度低。
3、每個Master也需要配置主從,并且內(nèi)部也是采用哨兵模式,如果有半數(shù)節(jié)點發(fā)現(xiàn)某個異常節(jié)點會共同決定更改異常節(jié)點的狀態(tài)。
4、如果集群中的master沒有slave節(jié)點,則master掛掉后整個集群就會進入fail狀態(tài),因為集群的slot映射不完整。如果集群超過半數(shù)以上的master掛掉,集群都會進入fail狀態(tài)。
5、官方推薦 集群部署至少要3臺以上的master節(jié)點。
8、Redis 限流
經(jīng)常乘坐北京西二旗地鐵或者在北京西站乘坐的時候經(jīng)常會遇到一種情況就是如果人很多,地鐵的工作人員拿個小牌前面一檔讓你等會兒再檢票,這就是實際生活應對人流量巨大的措施。
在開發(fā)高并發(fā)系統(tǒng)時,有三把利器用來保護系統(tǒng):緩存、降級和限流。那么何為限流呢?顧名思義,限流就是限制流量,就像你寬帶包了1個G的流量,用完了就沒了。通過限流,我們可以很好地控制系統(tǒng)的qps,從而達到保護系統(tǒng)的目的。
1、基于Redis的setnx、zset
1.2、setnx
比如我們需要在10秒內(nèi)限定20個請求,那么我們在setnx的時候可以設(shè)置過期時間10,當請求的setnx數(shù)量達到20時候即達到了限流效果。
缺點:比如當統(tǒng)計1-10秒的時候,無法統(tǒng)計2-11秒之內(nèi),如果需要統(tǒng)計N秒內(nèi)的M個請求,那么我們的Redis中需要保持N個key等等問題。
1.3、zset
其實限流涉及的最主要的就是滑動窗口,上面也提到1-10怎么變成2-11。其實也就是起始值和末端值都各+1即可。我們可以將請求打造成一個zset數(shù)組,當每一次請求進來的時候,value保持唯一,可以用UUID生成,而score可以用當前時間戳表示,因為score我們可以用來計算當前時間戳之內(nèi)有多少的請求數(shù)量。而zset數(shù)據(jù)結(jié)構(gòu)也提供了range方法讓我們可以很輕易的獲取到2個時間戳內(nèi)有多少請求,
缺點:就是zset的數(shù)據(jù)結(jié)構(gòu)會越來越大。
2、漏桶算法
漏桶算法思路:把水比作是請求,漏桶比作是系統(tǒng)處理能力極限,水先進入到漏桶里,漏桶里的水按一定速率流出,當流出的速率小于流入的速率時,由于漏桶容量有限,后續(xù)進入的水直接溢出(拒絕請求),以此實現(xiàn)限流。
3、令牌桶算法
令牌桶算法的原理:可以理解成醫(yī)院的掛號看病,只有拿到號以后才可以進行診病。
細節(jié)流程大致:
1、所有的請求在處理之前都需要拿到一個可用的令牌才會被處理。
2、根據(jù)限流大小,設(shè)置按照一定的速率往桶里添加令牌。
3、設(shè)置桶最大可容納值,當桶滿時新添加的令牌就被丟棄或者拒絕。
4、請求達到后首先要獲取令牌桶中的令牌,拿著令牌才可以進行其他的業(yè)務邏輯,處理完業(yè)務邏輯之后,將令牌直接刪除。
5、令牌桶有最低限額,當桶中的令牌達到最低限額的時候,請求處理完之后將不會刪除令牌,以此保證足夠的限流。
工程化:
1、自定義注解、aop、Redis + Lua 實現(xiàn)限流。
2、推薦 guava 的RateLimiter實現(xiàn)。
9、常見知識點
字符串模糊查詢時用Keys可能導致線程阻塞,盡量用scan指令進行無阻塞的取出數(shù)據(jù)然后去重下即可。
多個操作的情況下記得用pipeLine把所有的命令一次發(fā)過去,避免頻繁的發(fā)送、接收帶來的網(wǎng)絡開銷,提升性能。
bigkeys可以掃描redis中的大key,底層是使用scan命令去遍歷所有的鍵,對每個鍵根據(jù)其類型執(zhí)行STRLEN、LLEN、SCARD、HLEN、ZCARD這些命令獲取其長度或者元素個數(shù)。缺陷是線上試用并且個數(shù)多不一定空間大,
線上應用記得開啟Redis慢查詢?nèi)罩九?#xff0c;基本思路跟MySQL類似。
Redis中因為內(nèi)存分配策略跟增刪數(shù)據(jù)是會導致內(nèi)存碎片,你可以重啟服務也可以執(zhí)行activedefrag yes進行內(nèi)存重新整理來解決此問題。
1、Ratio >1 表明有內(nèi)存碎片,越大表明越多嚴重。
2、Ratio?< 1 表明正在使用虛擬內(nèi)存,虛擬內(nèi)存其實就是硬盤,性能比內(nèi)存低得多,這是應該增強機器的內(nèi)存以提高性能。
3、一般來說,mem_fragmentation_ratio的數(shù)值在1 ~ 1.5之間是比較健康的
往期推薦線程池的7種創(chuàng)建方式,強烈推薦你用它...
Redis的自白:我為什么在單線程的這條路上越走越遠?
Redis 6.0 正式版終于發(fā)布了!除了多線程還有什么新功能?
關(guān)注我,每天陪你進步一點點!
總結(jié)
以上是生活随笔為你收集整理的硬核Redis总结,看这篇就够了!的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 第 6-3 课:SpringBoot 核
- 下一篇: linux cmake编译源码,linu