【1】選擇排序、快速排序、希爾排序、堆排序不是穩定的排序算法
冒泡排序、插入排序、歸並排序和基數排序都是穩定的排序算法。
【2】研究排序算法的穩定性有何意義?
首先,排序算法的穩定性大家應該都知道,通俗地講就是能保證排序前兩個相等的數據其在序列中的先後位置順序與排序後它們兩個先後位置順序相同。
再簡單具體一點,如果A i == A j,Ai 原來在 Aj 位置前,排序後 Ai 仍然是在 Aj 位置前。
下面我們分析一下穩定性的好處:
(1)如果排序算法是穩定的,那麼從一個鍵上排序,然後再從另一個鍵上排序,第一個鍵排序的結果可以為第二個鍵排序所利用。
基數排序就是這樣,先按低位排序,逐次按高位排序,那麼,低位相同的數據元素其先後位置順序即使在高位也相同時是不會改變的。詳細請參見隨筆《基數排序》。
(2)學習排序原理時,可能編的程序裡面要排序的元素都是簡單類型,實際上真正應用時,可能是對一個復雜類型(自定義類型)的數組排序,
而排序的鍵值僅僅只是這個元素中的一個屬性,對於一個簡單類型,數字值就是其全部意義,即使交換了也看不出什麼不同。
但是,對於復雜類型,交換的話可能就會使原本不應該交換的元素交換了。比如:一個“學生”數組,欲按照年齡排序,“學生”這個對象不僅含有“年齡”,還有其它很多屬性。
假使原數組是把學號作為主鍵由小到大進行的數據整理。而穩定的排序會保證比較時,如果兩個學生年齡相同,一定不會交換。
那也就意味著盡管是對“年齡”進行了排序,但是學號順序仍然是由小到大的要求。
(3)如果排序算法穩定,對基於比較的排序算法而言,元素交換的次數可能相對會少一些(個人感覺,沒有證實)。
【3】各種排序算法穩定性分析
現在分析一下常見的排序算法的穩定性,每個都給出簡單的理由。
(1)冒泡排序
冒泡排序就是把小的元素往前調(或者把大的元素往後調)。注意是相鄰的兩個元素進行比較,而且是否需要交換也發生在這兩個元素之間。
所以,如果兩個元素相等,我想你是不會再無聊地把它們倆再交換一下。
如果兩個相等的元素沒有相鄰,那麼即使通過前面的兩兩交換把兩個元素相鄰起來,最終也不會交換它倆的位置,所以相同元素經過排序後順序並沒有改變。
所以冒泡排序是一種穩定排序算法。
(2)選擇排序
選擇排序即是給每個位置選擇待排序元素中當前最小的元素。比如給第一個位置選擇最小的,在剩余元素裡面給第二個位置選擇次小的,
依次類推,直到第n-1個元素,第n個元素不用選擇了,因為只剩下它一個最大的元素了。
那麼,在一趟選擇時,如果當前鎖定元素比後面一個元素大,而後面較小的那個元素又出現在一個與當前鎖定元素相等的元素後面,那麼交換後位置順序顯然改變了。
呵呵!比較拗口,舉個例子:序列5 8 5 2 9, 我們知道第一趟選擇第1個元素5會與2進行交換,那麼原序列中兩個5的相對先後順序也就被破壞了。
所以選擇排序不是一個穩定的排序算法。
(3)插入排序
插入排序是在一個已經有序的小序列的基礎上,一次插入一個元素。當然,剛開始這個有序的小序列只有1個元素,也就是第一個元素(默認它有序)。
比較是從有序序列的末尾開始,也就是把待插入的元素和已經有序的最大者開始比起,如果比它大則直接插入在其後面。
否則一直往前找直到找到它該插入的位置。如果遇見一個與插入元素相等的,那麼把待插入的元素放在相等元素的後面。
所以,相等元素的前後順序沒有改變,從原無序序列出去的順序仍是排好序後的順序,所以插入排序是穩定的。
(4)快速排序
快速排序有兩個方向,左邊的i下標一直往右走(當條件a[i] <= a[center_index]時),其中center_index是中樞元素的數組下標,一般取為數組第0個元素。
而右邊的j下標一直往左走(當a[j] > a[center_index]時)。
如果i和j都走不動了,i <= j, 交換a[i]和a[j],重復上面的過程,直到i>j。交換a[j]和a[center_index],完成一趟快速排序。
在中樞元素和a[j]交換的時候,很有可能把前面的元素的穩定性打亂,比如序列為 5 3 3 4 3 8 9 10 11
現在中樞元素5和3(第5個元素,下標從1開始計)交換就會把元素3的穩定性打亂。
所以快速排序是一個不穩定的排序算法,不穩定發生在中樞元素和a[j]交換的時刻。
(5)歸並排序
歸並排序是把序列遞歸地分成短序列,遞歸出口是短序列只有1個元素(認為直接有序)或者2個序列(1次比較和交換),
然後把各個有序的段序列合並成一個有序的長序列,不斷合並直到原序列全部排好序。
可以發現,在1個或2個元素時,1個元素不會交換,2個元素如果大小相等也沒有人故意交換,這不會破壞穩定性。
那麼,在短的有序序列合並的過程中,穩定是是否受到破壞?
沒有,合並過程中我們可以保證如果兩個當前元素相等時,我們把處在前面的序列的元素保存在結果序列的前面,這樣就保證了穩定性。
所以,歸並排序也是穩定的排序算法。
(6)基數排序
基數排序是按照低位先排序,然後收集;再按照高位排序,然後再收集;依次類推,直到最高位。
有時候有些屬性是有優先級順序的,先按低優先級排序,再按高優先級排序,最後的次序結果就是高優先級高的在前,高優先級相同的情況下低優先級高的在前。
基數排序基於分別排序,分別收集,所以其是穩定的排序算法。
(7)希爾排序
希爾排序是按照不同步長對元素進行插入排序,當剛開始元素很無序的時候,步長最大,所以插入排序的元素個數很少,速度很快;
當元素基本有序時,步長很小,插入排序對於有序的序列效率很高。所以,希爾排序的時間復雜度會比O(N^2)好一些。
由於多次插入排序,我們知道一次插入排序是穩定的,不會改變相同元素的相對順序,
但在不同的插入排序過程中,相同的元素可能在各自的插入排序中移動,最後其穩定性就會被打亂。
所以shell排序是不穩定的排序算法。
(8)堆排序
我們知道堆的結構是節點i的孩子為2*i和2*i+1節點,大頂堆要求父節點大於等於其2個子節點,小頂堆要求父節點小於等於其2個子節點。
在一個長為n的序列,堆排序的過程是從第n/2開始和其子節點共3個值選擇最大(大頂堆)或者最小(小頂堆),這3個元素之間的選擇當然不會破壞穩定性。
但當為n/2-1, n/2-2, ...1這些個父節點選擇元素時,就會破壞穩定性。
有可能第n/2個父節點交換把後面一個元素交換過去了,而第n/2-1個父節點把後面一個相同的元素沒有交換,那麼這2個相同的元素之間的穩定性就被破壞了。
所以,堆排序不是穩定的排序算法。
Good Good Study, Day Day Up.
順序 選擇 循環 堅持 總結