海量数据
用堆解決TopK問題:
找最大K個用小頂堆/最小K個用大頂堆:
長度為K的數組,存入K個數據,建立小頂堆
依次從K+1往后和堆頂比較,小于則pass,大于則替換并重新建立小頂堆
最終堆中K個元素即是要找的TopK
分布在不同電腦中:
同一種數據只出現在一臺電腦中:比正常多用一次TopK方法
同一種元素可以出現在不同電腦中:重新遍歷所有并hash取模,再用TopK
轉載于:https://www.cnblogs.com/zawjdbb/p/7340311.html
總結
- 上一篇: 在ubuntu16下安装virtuale
- 下一篇: [LeetCode] 9. Palind