Python實現數據結構常見算法
本文主要介紹了數據結構中的八大排序算法,利用Python分別將他們進行實現。
前言
八大排序,三大查找是《數據結構》當中非常基礎的知識點,在這里為了復習順帶總結了一下常見的八種排序算法。
常見的八大排序算法,他們之間關系如下:
排序算法
他們的性能比較:
性能比較
下面,利用Python分別將他們進行實現。
直接插入排序
算法思想:
直接插入排序
直接插入排序的核心思想就是:將數組中的所有元素依次跟前面已經排好的元素相比較,如果選擇的元素比已排序的元素小,則交換,直到全部元素都比較過。
因此,從上面的描述中我們可以發現,直接插入排序可以用兩個循環完成:
第一層循環:遍歷待比較的所有數組元素
第二層循環:將本輪選擇的元素(selected)與已經排好序的元素(ordered)相比較。如果:selected > ordered,那么將二者交換
代碼實現:
希爾排序
算法思想:
希爾排序
希爾排序的算法思想:將待排序數組按照步長gap進行分組,然后將每組的元素利用直接插入排序的方法進行排序;每次將gap折半減小,循環上述操作;當gap=1時,利用直接插入,完成排序。
同樣的:從上面的描述中我們可以發現:希爾排序的總體實現應該由三個循環完成:
第一層循環:將gap依次折半,對序列進行分組,直到gap=1
第二、三層循環:也即直接插入排序所需要的兩次循環。具體描述見上。
代碼實現:
簡單選擇排序
算法思想:
簡單選擇排序
簡單選擇排序的基本思想:比較+交換。
從待排序序列中,找到關鍵字最小的元素;
如果最小元素不是待排序序列的第一個元素,將其和第一個元素互換;
從余下的 N - 1 個元素中,找出關鍵字最小的元素,重復(1)、(2)步,直到排序結束。
因此我們可以發現,簡單選擇排序也是通過兩層循環實現。
第一層循環:依次遍歷序列當中的每一個元素
第二層循環:將遍歷得到的當前元素依次與余下的元素進行比較,符合最小元素的條件,則交換。
代碼實現:
堆排序
堆的概念:
堆:本質是一種數組對象。特別重要的一點性質:任意的葉子節點小于(或大于)它所有的父節點。對此,又分為大頂堆和小頂堆,大頂堆要求節點的元素都要大于其孩子,小頂堆要求節點元素都小于其左右孩子,兩者對左右孩子的大小關系不做任何要求。
利用堆排序,就是基于大頂堆或者小頂堆的一種排序方法。下面,我們通過大頂堆來實現。
基本思想:
堆排序可以按照以下步驟來完成:
首先將序列構建稱為大頂堆(這樣滿足了大頂堆那條性質:位于根節點的元素一定是當前序列的最大值);
構建大頂堆
取出當前大頂堆的根節點,將其與序列末尾元素進行交換(此時:序列末尾的元素為已排序的最大值;由于交換了元素,當前位于根節點的堆并不一定滿足大頂堆的性質);
對交換后的n-1個序列元素進行調整,使其滿足大頂堆的性質;
重復2.3步驟,直至堆中只有1個元素為止。
代碼實現:
冒泡排序
算法思想:
冒泡排序
冒泡排序思路比較簡單:
將序列當中的左右元素,依次比較,保證右邊的元素始終大于左邊的元素( 第一輪結束后,序列最后一個元素一定是當前序列的最大值);
對序列當中剩下的n-1個元素再次執行步驟1。
對于長度為n的序列,一共需要執行n-1輪比較(利用while循環可以減少執行次數)。
代碼實現:
快速排序
算法思想:
快速排序
快速排序的基本思想:挖坑填數+分治法
從序列當中選擇一個基準數(pivot),在這里我們選擇序列當中第一個數最為基準數;
將序列當中的所有數依次遍歷,比基準數大的位于其右側,比基準數小的位于其左側;
重復步驟1.2,直到所有子集當中只有一個元素為止。用偽代碼描述如下:
i =L; j = R; 將基準數挖出形成第一個坑a[i]。
j--由后向前找比它小的數,找到后挖出此數填前一個坑a[i]中。
i++由前向后找比它大的數,找到后也挖出此數填到前一個坑a[j]中。
再重復執行2,3二步,直到i==j,將基準數填入a[i]中
代碼實現:
歸并排序
算法思想:
歸并排序
歸并排序是建立在歸并操作上的一種有效的排序算法,該算法是采用分治法的一個典型的應用。它的基本操作是:將已有的子序列合并,達到完全有序的序列;即先使每個子序列有序,再使子序列段間有序。
歸并排序其實要做兩件事:
分解:將序列每次折半拆分
合并:將劃分后的序列段兩兩排序合并
因此,歸并排序實際上就是兩個操作,拆分+合并
如何合并?
L[first...mid]為第一段,L[mid+1...last]為第二段,并且兩端已經有序,現在我們要將兩端合成達到L[first...last]并且也有序。
首先依次從第一段與第二段中取出元素比較,將較小的元素賦值給temp[]
重復執行上一步,當某一段賦值結束,則將另一段剩下的元素賦值給temp[]
此時將temp[]中的元素復制給L[],則得到的L[first...last]有序
如何分解?
在這里,我們采用遞歸的方法,首先將待排序列分成A,B兩組;然后重復對A、B序列分組;直到分組后組內只有一個元素,此時我們認為組內所有元素有序,則分組結束。
代碼實現:
基數排序
算法思想:
基數排序
基數排序:通過序列中各個元素的值,對排序的N個元素進行若干趟的“分配”與“收集”來實現排序。
分配:我們將L[i]中的元素取出,首先確定其個位上的數字,根據該數字分配到與之序號相同的桶中
收集:當序列中所有的元素都分配到對應的桶中,再按照順序依次將桶中的元素收集形成新的一個待排序列L[ ]
對新形成的序列L[]重復執行分配和收集元素中的十位、百位...直到分配完該序列中的最高位,則排序結束。
根據上述“基數排序”的展示,我們可以清楚的看到整個實現的過程。
代碼實現:
后記
寫完之后運行了一下時間比較:
1w個數據時:
10w個數據時:
從運行結果上來看,堆排序、歸并排序、基數排序真的快。
對于快速排序迭代深度超過的問題,可以將考慮將快排通過非遞歸的方式進行實現。
來自:http://www.uml.org.cn/python/201712121.asp