20201014 《人工智能与大数据》第1节课 笔记
目錄
- 課程相關(guān)
- 推薦書(shū)籍
- 在n個(gè)數(shù)中查找出現(xiàn)次數(shù)超過(guò)一半的數(shù)字
- 在n個(gè)數(shù)中尋找出現(xiàn)次數(shù)最多的k個(gè)數(shù)字
- 估計(jì)n個(gè)數(shù)中出現(xiàn)次數(shù)最多的k個(gè)數(shù)字的出現(xiàn)次數(shù)
- 布隆過(guò)濾器
課程相關(guān)
李榮華 lironghuabit@126.com
主頁(yè) ronghuali.github.io
課程考核 大作業(yè)(綜述)
推薦書(shū)籍
- 王宏志,大數(shù)據(jù)算法,機(jī)械工業(yè)出版社,2015
- Jure Leskovec, Anand Rajaraman, Mining of Massive Datasets edition
- 中文版:大數(shù)據(jù)-互聯(lián)網(wǎng)大規(guī)模數(shù)據(jù)挖掘與分布式處理,王斌 譯,人民郵電出版社
在n個(gè)數(shù)中查找出現(xiàn)次數(shù)超過(guò)一半的數(shù)字
使用一個(gè)桶,數(shù)據(jù)按順序進(jìn)桶,如果桶中無(wú)數(shù)字,該數(shù)據(jù)進(jìn)桶,且計(jì)數(shù)1;如果桶中有數(shù)字,且與當(dāng)前數(shù)字不同,計(jì)數(shù)器減一;如果桶中有數(shù)字,且與當(dāng)前數(shù)字相同,計(jì)數(shù)器加一。當(dāng)計(jì)數(shù)器為零時(shí),桶清空。最終,桶中留下的數(shù)字即為最頻繁的數(shù)字。
在n個(gè)數(shù)中尋找出現(xiàn)次數(shù)最多的k個(gè)數(shù)字
- Misra-Gries算法
對(duì)于每個(gè)元素x:①若存在統(tǒng)計(jì)x的計(jì)數(shù)器,該計(jì)數(shù)器加一;②若不存在統(tǒng)計(jì)x的計(jì)數(shù)器,且計(jì)數(shù)器個(gè)數(shù)小于k,新建統(tǒng)計(jì)x的計(jì)數(shù)器且初始化為1;③若不存在統(tǒng)計(jì)x的計(jì)數(shù)器,且計(jì)數(shù)器個(gè)數(shù)為k,所有計(jì)數(shù)器數(shù)值減一,刪除數(shù)值為零的計(jì)數(shù)器。最終,k個(gè)計(jì)數(shù)器統(tǒng)計(jì)的x則為出現(xiàn)次數(shù)最多的數(shù)字,且計(jì)數(shù)器的值可作為對(duì)應(yīng)數(shù)字的出現(xiàn)次數(shù)的估計(jì)值。
估計(jì)n個(gè)數(shù)中出現(xiàn)次數(shù)最多的k個(gè)數(shù)字的出現(xiàn)次數(shù)
在Misra-Gries算法中,執(zhí)行步驟③會(huì)丟棄k+1個(gè)數(shù)字(k個(gè)計(jì)數(shù)器減一,且當(dāng)前數(shù)字沒(méi)有加入計(jì)數(shù))。我們可以計(jì)算最終得到的k個(gè)計(jì)數(shù)器內(nèi)值的和,并記為n‘。則,最多進(jìn)行了(n-n‘)/(k+1)次步驟③。因此,元素出現(xiàn)次數(shù)的估計(jì)值比真實(shí)值最多小(n-n‘)/(k+1)
布隆過(guò)濾器
作用:查詢(xún)一個(gè)數(shù)據(jù)是否在數(shù)據(jù)集中。
總結(jié)
以上是生活随笔為你收集整理的20201014 《人工智能与大数据》第1节课 笔记的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: ICCV 2019 运行LCGN遇到的问
- 下一篇: 20201014 《计算感知》第2节课