當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

海量数据

發布時間：2024/4/17 编程问答 33 豆豆

生活随笔收集整理的這篇文章主要介紹了海量数据小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

用堆解決TopK問題：

找最大K個用小頂堆/最小K個用大頂堆：

長度為K的數組，存入K個數據，建立小頂堆

依次從K+1往后和堆頂比較，小于則pass，大于則替換并重新建立小頂堆

最終堆中K個元素即是要找的TopK

分布在不同電腦中：

同一種數據只出現在一臺電腦中：比正常多用一次TopK方法

同一種元素可以出現在不同電腦中：重新遍歷所有并hash取模，再用TopK

轉載于:https://www.cnblogs.com/zawjdbb/p/7340311.html

以上是生活随笔為你收集整理的海量数据的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。