日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【坑】Sketch算法——Count-Min Sketch和Universal Sketch

發布時間:2024/8/23 编程问答 37 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【坑】Sketch算法——Count-Min Sketch和Universal Sketch 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章目錄

  • 參考鏈接
  • 一、Sketch算法用來做什么?
  • 二、Min-count sketch
    • 基礎思想:
    • 進階:
    • 特點:
  • 三、Universal Sketch

參考鏈接

[1] Count-Min Sketch: https://blog.csdn.net/pipisorry/article/details/64126199
[2] Cormode G, Muthukrishnan S. An improved data stream summary: the count-min sketch and its applications[J]. Journal of Algorithms, 2005, 55(1): 58-75.

一、Sketch算法用來做什么?

用于計數的算法,犧牲一定的準確性換來高效率,適合用在實時性要求比較高的場景。

二、Min-count sketch

Count-Min Sketch 由 Cormode 和 Muthukrishnan 等人于2005年提出,這是頻率估計問題的基本解決辦法之一。

基礎思想:

  • 創建一個長度為 x 的數組,用來計數。每個元素的計數值初始化為 0;
  • 對于每一個新來的元素,哈希到 0 到 x 之間的一個數,作為數組的索引:比如哈希值為 i,數組對應的位置索引 i 的計數值加 1;
  • 要查詢某個元素出現的頻率,返回這個元素哈希望后對應的數組的位置索引的計數值即可。
  • 進階:

    若數據類型很多,數組長度有限,極有可能互相沖突,即不同的數據hash到數組的同一個位置上,影響計數的精度;
    為了提高精度,使用多個數組和多個哈希函數。數組A對應哈希函數A,數組B對應哈希函數B,新到一個元素則在所有數組對應索引的位置都加1。
    要查詢某個元素出現的次數,則返回這些數組里面對應索引位置最小的(因此,叫min-count)。

    特點:

    • 計數只會估算偏大;
    • 需要固定大小的內存和計算時間,和需要統計的元素多少無關;
    • 對于低頻的元素,估算值相對的錯誤可能會很大。

    三、Universal Sketch

    總結

    以上是生活随笔為你收集整理的【坑】Sketch算法——Count-Min Sketch和Universal Sketch的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。