Python标准库——collections模块的Counter类
?
更多16最近在看一本名叫《Python Algorithm: Mastering Basic Algorithms in the Python Language》的書,剛好看到提到這個Counter類(P84的Listing 4.6下的Tip)。
1.collections模塊
collections模塊自Python 2.4版本開始被引入,包含了dict、set、list、tuple以外的一些特殊的容器類型,分別是:
- OrderedDict類:排序字典,是字典的子類。引入自2.7。
- namedtuple()函數(shù):命名元組,是一個工廠函數(shù)。引入自2.6。
- Counter類:為hashable對象計數(shù),是字典的子類。引入自2.7。
- deque:雙向隊列。引入自2.4。
- defaultdict:使用工廠函數(shù)創(chuàng)建字典,使不用考慮缺失的字典鍵。引入自2.5。
文檔參見:http://docs.python.org/2/library/collections.html。
2.Counter類
Counter類的目的是用來跟蹤值出現(xiàn)的次數(shù)。它是一個無序的容器類型,以字典的鍵值對形式存儲,其中元素作為key,其計數(shù)作為value。計數(shù)值可以是任意的Interger(包括0和負(fù)數(shù))。Counter類和其他語言的bags或multisets很相似。
2.1 創(chuàng)建
下面的代碼說明了Counter類創(chuàng)建的四種方法:
?
Counter類的創(chuàng)建 Python| 1 2 3 4 5 | >>> c = Counter()??# 創(chuàng)建一個空的Counter類 >>> c = Counter('gallahad')??# 從一個可iterable對象(list、tuple、dict、字符串等)創(chuàng)建 >>> c = Counter({'a': 4, 'b': 2})??# 從一個字典對象創(chuàng)建 >>> c = Counter(a=4, b=2)??# 從一組鍵值對創(chuàng)建 |
?
2.2 計數(shù)值的訪問與缺失的鍵
當(dāng)所訪問的鍵不存在時,返回0,而不是KeyError;否則返回它的計數(shù)。
?
計數(shù)值的訪問 Python| 1 2 3 4 5 6 7 8 | >>> c = Counter("abcdefgab") >>> c["a"] 2 >>> c["c"] 1 >>> c["h"] 0 |
?
2.3 計數(shù)器的更新(update和subtract)
可以使用一個iterable對象或者另一個Counter對象來更新鍵值。
計數(shù)器的更新包括增加和減少兩種。其中,增加使用update()方法:
計數(shù)器的更新(update) Python| 1 2 3 4 5 6 7 8 9 | >>> c = Counter('which') >>> c.update('witch')??# 使用另一個iterable對象更新 >>> c['h'] 3 >>> d = Counter('watch') >>> c.update(d)??# 使用另一個Counter對象更新 >>> c['h'] 4 |
?
減少則使用subtract()方法:
計數(shù)器的更新(subtract) Python| 1 2 3 4 5 6 7 8 9 | >>> c = Counter('which') >>> c.subtract('witch')??# 使用另一個iterable對象更新 >>> c['h'] 1 >>> d = Counter('watch') >>> c.subtract(d)??# 使用另一個Counter對象更新 >>> c['a'] -1 |
?
2.4 鍵的刪除
當(dāng)計數(shù)值為0時,并不意味著元素被刪除,刪除元素應(yīng)當(dāng)使用del。
?
鍵的刪除 Python| 1 2 3 4 5 6 7 8 9 10 | >>> c = Counter("abcdcba") >>> c Counter({'a': 2, 'c': 2, 'b': 2, 'd': 1}) >>> c["b"] = 0 >>> c Counter({'a': 2, 'c': 2, 'd': 1, 'b': 0}) >>> del c["a"] >>> c Counter({'c': 2, 'b': 2, 'd': 1}) |
?
2.5 elements()
返回一個迭代器。元素被重復(fù)了多少次,在該迭代器中就包含多少個該元素。元素排列無確定順序,個數(shù)小于1的元素不被包含。
?
elements()方法 Python| 1 2 3 | >>> c = Counter(a=4, b=2, c=0, d=-2) >>> list(c.elements()) ['a', 'a', 'a', 'a', 'b', 'b'] |
?
2.6 most_common([n])
返回一個TopN列表。如果n沒有被指定,則返回所有元素。當(dāng)多個元素計數(shù)值相同時,排列是無確定順序的。
?
most_common()方法 Python| 1 2 3 4 5 | >>> c = Counter('abracadabra') >>> c.most_common() [('a', 5), ('r', 2), ('b', 2), ('c', 1), ('d', 1)] >>> c.most_common(3) [('a', 5), ('r', 2), ('b', 2)] |
?
2.7 fromkeys
未實現(xiàn)的類方法。
2.8 淺拷貝copy
?
淺拷貝copy Python| 1 2 3 4 5 6 | >>> c = Counter("abcdcba") >>> c Counter({'a': 2, 'c': 2, 'b': 2, 'd': 1}) >>> d = c.copy() >>> d Counter({'a': 2, 'c': 2, 'b': 2, 'd': 1}) |
?
2.9 算術(shù)和集合操作
+、-、&、|操作也可以用于Counter。其中&和|操作分別返回兩個Counter對象各元素的最小值和最大值。需要注意的是,得到的Counter對象將刪除小于1的元素。
?
Counter對象的算術(shù)和集合操作 Python| 1 2 3 4 5 6 7 8 9 10 | >>> c = Counter(a=3, b=1) >>> d = Counter(a=1, b=2) >>> c + d??# c[x] + d[x] Counter({'a': 4, 'b': 3}) >>> c - d??# subtract(只保留正數(shù)計數(shù)的元素) Counter({'a': 2}) >>> c & d??# 交集:??min(c[x], d[x]) Counter({'a': 1, 'b': 1}) >>> c | d??# 并集:??max(c[x], d[x]) Counter({'a': 3, 'b': 2}) |
?
3.常用操作
下面是一些Counter類的常用操作,來源于Python官方文檔
?
Counter類常用操作 Python| 1 2 3 4 5 6 7 8 9 | sum(c.values())??# 所有計數(shù)的總數(shù) c.clear()??# 重置Counter對象,注意不是刪除 list(c)??# 將c中的鍵轉(zhuǎn)為列表 set(c)??# 將c中的鍵轉(zhuǎn)為set dict(c)??# 將c中的鍵值對轉(zhuǎn)為字典 c.items()??# 轉(zhuǎn)為(elem, cnt)格式的列表 Counter(dict(list_of_pairs))??# 從(elem, cnt)格式的列表轉(zhuǎn)換為Counter類對象 c.most_common()[:-n:-1]??# 取出計數(shù)最少的n-1個元素 c += Counter()??# 移除0和負(fù)值 |
?
本文內(nèi)容遵從CC3.0版權(quán)協(xié)議,轉(zhuǎn)載請注明:轉(zhuǎn)自Pythoner
總結(jié)
以上是生活随笔為你收集整理的Python标准库——collections模块的Counter类的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python List extend()
- 下一篇: Python---哈夫曼树---Huff