日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

简单介绍布隆过滤器

發布時間:2025/3/17 编程问答 20 豆豆
生活随笔 收集整理的這篇文章主要介紹了 简单介绍布隆过滤器 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

2019獨角獸企業重金招聘Python工程師標準>>>

一句話介紹

布隆過濾器(Bloom Filter)是1970年由布隆提出的。它實際上是一個很長的二進制向量和一系列隨機映射函數。布隆過濾器可以用于檢索一個元素是否在一個集合中。它的優點是空間效率和查詢時間都遠遠超過一般的算法,缺點是有一定的誤識別率和刪除困難。
From 百度百科?

輸入與輸出

S:目標查找元素
Z: 被查找元素集(set)
Input: S,Z
Output:
True, S存在于Z
False, S不存在于Z

?

實際例子

但從文字上是很難理解的,下面舉個實際的例子:

00000000000000000000

? 0? ?1? ? 2? 3? ?4? ?5? ? 6? ?7? ?8? ?9? ?10? 11? ?12? 13? 14? 15 16? 17? 18? 19

1. 首先初始化一個size為20、初始值全為0的數組,和兩個hash函數(hash函數的個數由自己定,為講解方便這里使用兩個):

hashA(x) 和 hashB(x)
函數自己定義就好,只要output能對應到數組的key就行。

另外還有一個被查找元素集:

{'wo','shi','sevens','chan'}

2. 把被查找元素集的每個元素都經過所有的hash函數:

'wo' -> hashA('wo') -> 3
'wo' -> hashB('wo') -> 8

把得到的hash值找到數組的key,然后將值改為1:

00010000100000000000

? 0? ?1? ? 2? 3? ?4? ?5? ? 6? ?7? ?8? ?9? ?10? 11? ?12? 13? 14? 15 16? 17? 18? 19

同理把所有元素都處理一遍最后得到數組:

01110010100010110000

? 0? ?1? ? 2? 3? ?4? ?5??6? ?7? ?8? ?9? 10? 11?12? 13? 14? 15 16? 17? 18? 19

3. 然后就開始查找我們的目標元素(假設我們要查找'sevens')是否在集合中,同理,先把目標元素進行一遍hash取值:

'sevens' -> hashA('sevens') -> 6
'sevens' -> hashB('sevens') -> 15

根據兩個hash值可以看到,數組中6和15的位置都為1,所以元素可能存在集合中。反之如果有一個為0,都肯定不存在集合中。

可能存在

是的,布隆過濾器是存在一定的誤差率的,特別是數據量大的時候,所以我們只能說元素可能存在集合中。在允許誤差的場景下還是可以使用的。

轉載于:https://my.oschina.net/u/203607/blog/1649101

總結

以上是生活随笔為你收集整理的简单介绍布隆过滤器的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。