数据结构排序总结
【0】README
0.1) 本文總結于 數據結構與算法分析+個人的學習心得體會,源代碼均為原創;
0.2) 本文列出了數據結構中基本上所有的數據結構排序算法, 整理了相關的博文(源代碼);
0.3)對于數據結構排序的遺憾是, 這個排序,哥子已經搞了整整1周了,搞乏了,所以沒有實現 以 Sedgewick 增量序列 { 或者是 9*4^i - 9*2^i + 1或者是 4^i - 3*2^i + 1; 如,1, 5, 19, 41,……} 的希爾排序 源代碼, 其時間復雜度為O(N^(7/6)),等有時間再來實現;其實也不難,因為我已經實現了希爾排序的 hibbard增量序列 {1, 3, …, 2^k-1},其時間復雜度為O(N^(3/2));所以還是有必要實現Sedgewick 增量序列 的希爾排序的(等心情好了,哈哈,心情好了,對的,就來實現它),哎,確實該換換口味了;
【1】總結(Conclusion):
C1)對于最一般的內部排序,選用的方法不是插入排序、希爾排序,就是快速排序,它們的選用主要是根據輸入的大小來決定的; 下圖顯示了每個算法運行的時間對比:
- (對上述圖片的說明)(Declaration)
- D1)選擇N個整數組成一些隨機排序,而表中給出 的各項僅僅是 排序的實際時間;
- D2)我們看到,快速排序的性能是比較高的(待排序元素個數大于10),其次是希爾排序, 然后插入排序(待排序元素個數小于10);
- D3)數據結構排序算法性能排行榜
C2)希爾排序: http://blog.csdn.net/pacosonswjtu/article/details/49660799
- C2.1)該程序如果改為使用 Sedgewick 增量 { 或者是 9*4^i - 9*2^i + 1或者是 4^i - 3*2^i + 1; 如,1, 5, 19, 41,109, …… } 運行,基于數以百萬次計排序的話, 大小從100~ 25 000 000 不等, 使用這種增量的希爾排序預計的運行時間估計為 O(N^(7/6));(而如果使用 hibbard增量序列 的話, 最壞情況是 Ω(N^(3/2)) )
- C2.2)對輸入數據隨機的假設是不安全的。如果你不想過多考慮這個問題,那么你就使用希爾排序。希爾排序的最壞情況也只不過是 O(N^(4/3));
C3)堆排序: 堆排序要比希爾排序慢, 盡管它是一個帶有明顯緊湊內循環的 O(NlogN)算法。對該算法的深入考察揭示出, 為了移動數據,堆排序需要進行兩次比較; http://blog.csdn.net/pacosonswjtu/article/details/49660909
C4)快速排序:注意它選取樞紐元 時 所使用的方法是 三數中值分割法,截止范圍為10(也就是,如果排序的數組個數小于10, 就不選擇快速排序, 而是選擇其他排序方法, 如希爾排序或插入排序); http://blog.csdn.net/pacosonswjtu/article/details/48879419
- C4.1)快速排序的改進算法仍然有 O(N^2)的最壞情況, 但是,這種最壞情況出現的機會是如此地微不足道,以至于并不影響算法的性能;
- C4.2)切記,永遠不要圖省事,把第一個元素作為樞紐元(而是采用三數中值分割法);
- C4.3) 而且由 快速排序,我們還引入 了 快速選擇算法,參見: http://blog.csdn.net/pacosonswjtu/article/details/48915197
C5)插入排序:插入排序只用在小的或是非常接近排好序的輸入數據上。 http://blog.csdn.net/pacosonswjtu/article/details/48879263
C6)歸并排序:我們并沒有包含進來歸并排序, 因為它的性能對于主存排序不如快速排序那么好, 而且他的編程一點也不省事; http://blog.csdn.net/pacosonswjtu/article/details/49661005
C7)外部排序:合并是外部排序 的思想;
C8)桶排序+基數排序: 在某些特殊情況下以線性時間運行仍然是可能的,比如桶排序或者 基數排序(等同于多次桶排序);
http://blog.csdn.net/pacosonswjtu/article/details/49687193 + http://blog.csdn.net/pacosonswjtu/article/details/49685749
總結
- 上一篇: 【3】flink sink
- 下一篇: 算法递归简论