Redis(十):Redis特殊类型之Hyperloglog基数统计
redis 2.8.9版本就更新了Hyperloglog數(shù)據(jù)結(jié)構(gòu)!
Hyperloglog:基數(shù)統(tǒng)計算法!0.81%的錯誤率,不過統(tǒng)計大量數(shù)據(jù)可以忽略!
在 Redis 里面,每個 HyperLogLog 鍵只需要花費(fèi) 12 KB 內(nèi)存,就可以計算接近 2^64 個不同元素的基 數(shù)。這和計算基數(shù)時,元素越多耗費(fèi)內(nèi)存就越多的集合形成鮮明對比。
但是,因?yàn)?HyperLogLog 只會根據(jù)輸入元素來計算基數(shù),而不會儲存輸入元素本身,所以 HyperLogLog 不能像集合那樣,返回輸入的各個元素。
1、什么是基數(shù)
比如數(shù)據(jù)集 {1, 3, 5, 7, 5, 7, 8}, 那么這個數(shù)據(jù)集的基數(shù)集為 {1, 3, 5 ,7, 8}, 基數(shù)(不重復(fù)元素)為5。 基數(shù)估計就是在誤差可接受的范圍內(nèi),快速計算基數(shù)。
A{1,3,6,7,5,6}
B{1,3,5,7,6}
兩個的基數(shù)都(不重復(fù)的元素)=5,可以接受誤差!
2、Hyperloglog簡介
Redis Hyperloglog 基數(shù)統(tǒng)計的算法!
比如在CSDN中一位用戶訪問多次,但是統(tǒng)計中依舊算作一個人
傳統(tǒng)的方式是用set集合把每個人的id保存下來,然后統(tǒng)計元素數(shù)量,但是太費(fèi)內(nèi)存了,而目標(biāo)是統(tǒng)計數(shù)量,如果還要浪費(fèi)大量的空間,就很不劃算!
優(yōu)點(diǎn):占用的內(nèi)存是固定的,統(tǒng)計2^64這么大的基數(shù),只占用12kb的內(nèi)存,就很方便!
3、常用命令
127.0.0.1:6379> PFADD thekey1 a b c d e f g h i j k l m //創(chuàng)建第一組元素 (integer) 1 127.0.0.1:6379> PFADD thekey2 n o p q r s t u v w x y z //創(chuàng)建第二組元素 (integer) 1 127.0.0.1:6379> PFCOUNT thekey1 //查詢數(shù)量 (integer) 13 127.0.0.1:6379> PFCOUNT thekey2 (integer) 13 127.0.0.1:6379> PFMERGE thekey3 thekey1 thekey2 //合并兩組 OK 127.0.0.1:6379> PFCOUNT thekey3 (integer) 25 //百分之零點(diǎn)八的誤差出現(xiàn)了?允許容錯的話,可以使用Hyperloglog
創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎勵來咯,堅(jiān)持創(chuàng)作打卡瓜分現(xiàn)金大獎總結(jié)
以上是生活随笔為你收集整理的Redis(十):Redis特殊类型之Hyperloglog基数统计的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 腾讯云ubuntu18安装图形化界面
- 下一篇: mysqldump备份(全量+增量)