queensf
总版主
总版主
  • 注册日期2003-12-04
  • 发帖数735
  • QQ
  • 铜币3枚
  • 威望0点
  • 贡献值0点
  • 银元0个
阅读:1758回复:1

数据结构学习(C++)续——排序【5】归并排序

楼主#
更多 发布于:2004-05-10 22:15
<H2 >【<FONT face=Arial>5</FONT>】归并排序</H2>
<P ><FONT size=3>当初学习链表的时候,我们都曾经做过将两个有序链表合成一个有序链表的练习。那时我们就知道了归并的特点就是,将分段有序的序列合成整体有序的序列。在内部排序中,归并的地位并不十分重要,主要是因为附加的O(n)的储存空间;但是,归并却是外部排序的不二法门——我们只能用内排得到分段有序的序列,为了得到最后的有序序列,必须使用归并的方法。</FONT></P>
<H3 ><FONT size=5>迭代的2路归并排序</FONT></H3>
<P ><FONT size=3>2路归并是最简单的,并且单纯对内存中数据操作2路的往往是最好的(比如平衡树,AVL树经常优于m叉的平衡树)。所谓的迭代就是先归并len=1的N个序列,然后是len=2的N/2个序列,len=4的N/4个序列……最后归并2个序列就完成了。实际写的时候,需要一个和原来序列一样大小的临时数组。执行偶数次“一趟归并”能够使得最后的结果保存在原来的数组中。</FONT></P>
<P ><FONT size=3>//迭代2路归并排序及其所需的子程序</FONT></P>
<P ><FONT size=3>template <class T></FONT></P>
<P ><FONT size=3>void Merge(T S[], T D[], int l, int m, int n, int; KCN, int; RMN)</FONT></P>
<P ><FONT size=3>{</FONT></P>
<P ><FONT size=3>       //S[]源表,D[]归并后的表,l源表第一个段的起始序号,m源表第二个段的起始序号,n源表的长度</FONT></P>
<P ><FONT size=3>       int i = l, j = m, k = l;//i第一段的指针,j第二段的指针,k目的表指针</FONT></P>
<P ><FONT size=3>       for (; i < m ;; j < n; RMN++, k++)</FONT></P>
<P ><FONT size=3>              if (++KCN ;; S > S[j]) { D[k] = S[j]; j++; } else { D[k] = S; i++; }</FONT></P>
<P ><FONT size=3>       if (i < m)</FONT></P>
<P ><FONT size=3>              for (; i < m; i++, k++, RMN++) D[k] = S;</FONT></P>
<P ><FONT size=3>       else</FONT></P>
<P ><FONT size=3>              for (; j < n; j++, k++, RMN++) D[k] = S[j];</FONT></P>
<P ><FONT size=3>}</FONT></P>
<P ><FONT size=3>template <class T></FONT></P>
<P ><FONT size=3>void MergePass(T S[], T D[], int len, int N, int; KCN, int; RMN)</FONT></P>
<P ><FONT size=3>{</FONT></P>
<P ><FONT size=3>       int i = 0;</FONT></P>
<P ><FONT size=3>       for (; i+2*len < N; i += 2*len) Merge(S, D, i, i+len, i+2*len, KCN, RMN);</FONT></P>
<P ><FONT size=3>       if (i+len < N) Merge(S, D, i, i+len, N, KCN, RMN);//剩余多于一个len,再做一次归并</FONT></P>
<P ><FONT size=3>       else for (; i < N; i++, RMN++) D = S;//少于等于一个len,直接复制</FONT></P>
<P ><FONT size=3>}</FONT></P>
<P ><FONT size=3>template <class T></FONT></P>
<P ><FONT size=3>void MergeSort(T a[], int N, int; KCN, int; RMN)</FONT></P>
<P ><FONT size=3>{</FONT></P>
<P ><FONT size=3>       KCN = 0; RMN = 0;</FONT></P>
<P ><FONT size=3>       T* temp = new T[N]; int len = 1;</FONT></P>
<P ><FONT size=3>       while (len < N)//固定执行偶数次MergePass,最后的结果在原来的数组里</FONT></P>
<P ><FONT size=3>       {</FONT></P>
<P ><FONT size=3>              MergePass(a, temp, len, N, KCN, RMN); len *= 2;</FONT></P>
<P ><FONT size=3>              MergePass(temp, a, len, N, KCN, RMN); len *= 2;</FONT></P>
<P ><FONT size=3>       }</FONT></P>
<P ><FONT size=3>       delete []temp;</FONT></P>
<P ><FONT size=3>}</FONT></P>
<P ><FONT size=3>测试结果,直接取N=100000:</FONT></P>
<P ><FONT size=3>Sort ascending  N=100000        TimeSpared: 210ms</FONT></P>
<P ><FONT size=3>KCN=877968     KCN/N=8.77968    KCN/N^2=8.77968e-005KCN/NlogN=0.528589</FONT></P>
<P ><FONT size=3><B>RMN=1800000</B>    RMN/N=18         RMN/N^2=0.00018    RMN/NlogN=1.08371</FONT></P>
<P ><FONT size=3>Sort randomness N=100000        TimeSpared: 230ms</FONT></P>
<P ><FONT size=3>KCN=1529317    KCN/N=15.2932    KCN/N^2=0.000152932KCN/NlogN=0.920741</FONT></P>
<P ><FONT size=3><B>RMN=1800000</B>    RMN/N=18         RMN/N^2=0.00018    RMN/NlogN=1.08371</FONT></P>
<P ><FONT size=3>Sort descending N=100000        TimeSpared: 201ms</FONT></P>
<P ><FONT size=3>KCN=815024     KCN/N=8.15024    KCN/N^2=8.15024e-005KCN/NlogN=0.490693</FONT></P>
<P ><FONT size=3><B>RMN=1800000</B>    RMN/N=18         RMN/N^2=0.00018    RMN/NlogN=1.08371</FONT></P>
<P ><FONT size=3>可以看到RMN是个定值,RMN/N的值是不小于log<SUB>2</SUB>N的最小偶数,有兴趣比较一下N=1和N=2的差异就明白了。和快排(N=100000,乱序)相比,虽然归并的KCN和RMN都要少一些,但快排的速度还是要比归并排序快一倍(说明归并的额外动作多了一些),这个现象的确值得我们思考,这也是我加上KCN和RMN统计的一个意外收获——归并比快排慢不是因为KCN和RMN比快排多,而是一些额外的东西。</FONT></P>
<P ><FONT size=3>仔细分析就会发现,归并的多余时耗主要在小段归并上,如果我们用在N非常小的时候最为高效的直插来代替此时的归并,应该能带来效率的提升。如下面的例程,首先用直插来产生len=32的初始归并段,然后再归并:</FONT></P>
<P ><FONT size=3>template <class T></FONT></P>
<P ><FONT size=3>void MergeSort(T a[], int N, int; KCN, int; RMN)</FONT></P>
<P ><FONT size=3>{</FONT></P>
<P ><FONT size=3>       KCN = 0; RMN = 0;</FONT></P>
<P ><FONT size=3>       T* temp = new T[N]; int len = 32, i, j, k;</FONT></P>
<P ><FONT size=3>//分段进行直插排序,生成初始为len长的归并段</FONT></P>
<P ><p><FONT size=3> </FONT></p></P>
<P ><B><FONT size=3>       for (k = 1; k < N; k += len)<p></p></FONT></B></P>
<P ><B><FONT size=3>       {<p></p></FONT></B></P>
<P ><FONT size=3><B>              for (i = k; i < k+len-1 ;; i < N; i++)//</B><B>为了避免i<N</B><B>这个判断,可以对原序列剩余小于len</B><B>的序列另写一个直插<p></p></B></FONT></P>
<P ><B><FONT size=3>              {<p></p></FONT></B></P>
<P ><B><FONT size=3>                     T temp = a; RMN++;<p></p></FONT></B></P>
<P ><B><FONT size=3>                     for (j = i; j >= k ;; ++KCN ;; temp < a[j - 1]; j--) { a[j] = a[j - 1]; RMN++; }<p></p></FONT></B></P>
<P ><B><FONT size=3>                     a[j] = temp; RMN++;<p></p></FONT></B></P>
<P ><B><FONT size=3>              }<p></p></FONT></B></P>
<P ><B><FONT size=3>       }<p></p></FONT></B></P>
<P ><p><FONT size=3> </FONT></p></P>
<P ><FONT size=3>       while (len < N)//固定执行偶数次MergePass,最后的结果在原来的数组里</FONT></P>
<P ><FONT size=3>       {</FONT></P>
<P ><FONT size=3>              MergePass(a, temp, len, N, KCN, RMN); len *= 2;</FONT></P>
<P ><FONT size=3>              MergePass(temp, a, len, N, KCN, RMN); len *= 2;</FONT></P>
<P ><FONT size=3>       }</FONT></P>
<P ><FONT size=3>       delete []temp;</FONT></P>
<P ><FONT size=3>}</FONT></P>
<P ><FONT size=3>测试结果:</FONT></P>
<P ><FONT size=3>Sort ascending  N=100000        TimeSpared: 160ms</FONT></P>
<P ><FONT size=3>KCN=724843     KCN/N=7.24843    KCN/N^2=7.24843e-005KCN/NlogN=0.436399</FONT></P>
<P ><FONT size=3>RMN=1393750    RMN/N=13.9375    RMN/N^2=0.000139375RMN/NlogN=0.839121</FONT></P>
<P ><FONT size=3>Sort randomness N=100000        TimeSpared: 160ms</FONT></P>
<P ><FONT size=3>KCN=2009896    KCN/N=20.099     KCN/N^2=0.00020099 KCN/NlogN=1.21008</FONT></P>
<P ><FONT size=3>RMN=2166630    RMN/N=21.6663    RMN/N^2=0.000216663RMN/NlogN=1.30444</FONT></P>
<P ><FONT size=3>Sort descending N=100000        TimeSpared: 170ms</FONT></P>
<P ><FONT size=3>KCN=2115024    KCN/N=21.1502    KCN/N^2=0.000211502KCN/NlogN=1.27337</FONT></P>
<P ><FONT size=3>RMN=2943750    RMN/N=29.4375    RMN/N^2=0.000294375RMN/NlogN=1.77231</FONT></P>
<P ><FONT size=3>对于N=100000乱序排序减少了70ms,应该说是比较满意的。</FONT></P>
<H3 ><FONT size=5>递归的2路表归并排序</FONT></H3>
<P ><FONT size=3>很自然的,除了从len=1开始两两归并外,还可以从len=N开始,1/2分裂成左右序列分别归并排序,这是一个递归过程。如果我们仔细的观察这个递归,会发现这和前面的迭代是一样的(N=2<SUP>k</SUP>的情况)。递归带来的好处是可以方便的使用静态链表(非常容易实现表头的动态产生和消亡),如果我们不使用链表,研究递归的归并也没什么意思。</FONT></P>
<P ><FONT size=3>//递归的2路表归并排序及其所需子程序</FONT></P>
<P ><FONT size=3>template <class T></FONT></P>
<P ><FONT size=3>int ListMerge(T a[], int link[], int head1, int head2, int; KCN)</FONT></P>
<P ><FONT size=3>{</FONT></P>
<P ><FONT size=3>       int k, head, i = head1, j = head2;//i,j为两个链表的游标,k为结果链表游标,结果链表的表头为head</FONT></P>
<P ><FONT size=3>       //因为没有表头节点,表头需单独处理</FONT></P>
<P ><FONT size=3>if (++KCN ;; a > a[j]) { head = j; k = j; j = link[j]; }</FONT></P>
<P ><FONT size=3>       else { head = i; k = i; i = link; }</FONT></P>
<P ><FONT size=3>       while (i != -1 ;; j != -1)</FONT></P>
<P ><FONT size=3>       {</FONT></P>
<P ><FONT size=3>              if (++KCN ;; a > a[j]) { link[k] = j; k = j; j = link[j]; }</FONT></P>
<P ><FONT size=3>              else { link[k] = i; k = i; i = link; }</FONT></P>
<P ><FONT size=3>       }</FONT></P>
<P ><FONT size=3>       if (i == -1) link[k] = j;//i链检测完,j链接上</FONT></P>
<P ><FONT size=3>       else link[k] = i;//否则,i链接上</FONT></P>
<P ><FONT size=3>       return head;//返回头指针</FONT></P>
<P ><FONT size=3>}</FONT></P>
<P ><FONT size=3>template <class T></FONT></P>
<P ><FONT size=3>int rMergeSort(T a[], int link[], int low, int high, int; KCN)</FONT></P>
<P ><FONT size=3>{</FONT></P>
<P ><FONT size=3>       if (low >= high) return low;</FONT></P>
<P ><FONT size=3>       int mid = (low + high)/2;</FONT></P>
<P ><FONT size=3>       return ListMerge(a, link, rMergeSort(a, link, low, mid, KCN), rMergeSort(a, link, mid+1, high, KCN), KCN);</FONT></P>
<P ><FONT size=3>}</FONT></P>
<P ><FONT size=3>template <class T></FONT></P>
<P ><FONT size=3>void ListMergeSort(T a[], int N, int; KCN, int; RMN)</FONT></P>
<P ><FONT size=3>{</FONT></P>
<P ><FONT size=3>       KCN = 0; RMN = 0; int i, cur, pre;</FONT></P>
<P ><FONT size=3>       int* link = new int[N];</FONT></P>
<P ><FONT size=3>       for (i = 0; i < N; i++) link = -1;</FONT></P>
<P ><FONT size=3>       cur = rMergeSort(a, link, 0, N - 1, KCN);</FONT></P>
<P ><FONT size=3>       for (i = 0; i < N; i++)//重排</FONT></P>
<P ><FONT size=3>       {</FONT></P>
<P ><FONT size=3>              while (cur < i) cur = link[cur];</FONT></P>
<P ><FONT size=3>              pre = link[cur];</FONT></P>
<P ><FONT size=3>              if (cur != i)</FONT></P>
<P ><FONT size=3>              {</FONT></P>
<P ><FONT size=3>                     swap(a, a[cur]); RMN += 3;</FONT></P>
<P ><FONT size=3>                     link[cur] = link; link = cur;</FONT></P>
<P ><FONT size=3>              }</FONT></P>
<P ><FONT size=3>              cur = pre;</FONT></P>
<P ><FONT size=3>       }</FONT></P>
<P ><FONT size=3>       delete []link;</FONT></P>
<P ><FONT size=3>}</FONT></P>
<P ><FONT size=3>这里的rMergeSort可以算是个间接递归的例子,注意递归是如何自动完成表头的创建与回收的——的确是个很精巧的实现,如果反过来用迭代来实现,将会很麻烦。</FONT></P>
<P ><FONT size=3>测试结果:</FONT></P>
<P ><FONT size=3>Sort ascending  N=100000        TimeSpared: 50ms</FONT></P>
<P ><FONT size=3>KCN=853904     KCN/N=8.53904    KCN/N^2=8.53904e-005KCN/NlogN=0.514101</FONT></P>
<P ><FONT size=3>RMN=0          RMN/N=0          RMN/N^2=0          RMN/NlogN=0</FONT></P>
<P ><FONT size=3>Sort randomness N=100000        TimeSpared: 350ms</FONT></P>
<P ><FONT size=3>KCN=1509031    KCN/N=15.0903    KCN/N^2=0.000150903KCN/NlogN=0.908527</FONT></P>
<P ><FONT size=3>RMN=299973     RMN/N=2.99973    RMN/N^2=2.99973e-005RMN/NlogN=0.180602</FONT></P>
<P ><FONT size=3>Sort descending N=100000        TimeSpared: 70ms</FONT></P>
<P ><FONT size=3>KCN=815024     KCN/N=8.15024    KCN/N^2=8.15024e-005KCN/NlogN=0.490693</FONT></P>
<P ><FONT size=3>RMN=150000     RMN/N=1.5        RMN/N^2=1.5e-005   RMN/NlogN=0.090309</FONT></P>
<P ><FONT size=3>少有的在正序和逆序都有上佳表现的排序方法,但就其平均性能来说,并不十分优秀。</FONT></P>
<!--内容结束//-->
喜欢0 评分0
[color=blue][size=4][i][b][u] 【 解决不了的事情,就不要想。世界不会因为我而改变。 】 [/size][/u][/b][/i][/color]
Samuel_na
路人甲
路人甲
  • 注册日期2004-04-18
  • 发帖数49
  • QQ
  • 铜币241枚
  • 威望0点
  • 贡献值0点
  • 银元0个
1楼#
发布于:2004-05-11 12:20
 你好强啊!
在教室睡觉,在图书馆吃东西,在食堂自习,在寝室读书……
举报 回复(0) 喜欢(0)     评分
游客

返回顶部