数据结构各种排序算法的时间性能.doc可修改原格式下载

资源描述

1、设计一组实验来比较下列排序算法的时间性能快速排序、堆排序、希尔排序、冒泡排序、归并排序(其他排序也可以作为比较的对象）要求 (1)时间性能包括平均时间性能、最好情况下的时间性能、最差情况下的时间性能等。 (2)实验数据应具有说服力，包括：数据要有一定的规模（如元素个数从100到10000）；数据的初始特性类型要多，因而需要具有随机性；实验数据的组数要多，即同一规模的数组要多选几种不同类型的数据来实验。实验结果要能以清晰的形式给出，如图、表等。 (3)算法所用时间必须是机器时间，也可以包括比较和交换元素的次数。 (4)实验分析及其结果要能以清晰的方式来描述，如数学公式或图表等。(5)要给出实

2、验的方案及其分析。说明本题重点在以下几个方面：理解和掌握以实验方式比较算法性能的方法；掌握测试实验方案的设计；理解并实现测试数据的产生方法；掌握实验数据的分析和结论提炼；实验结果汇报等。一、需求分析(1) 输入的形式和输入值的范围：本程序要求实现各种算法的时间性能的比较，由于需要比较的数目较大，不能手动输入，于是采用系统生成随机数。用户输入随机数的个数n，然后调用随机事件函数产生n个随机数，对这些随机数进行排序。于是数据为整数(2) 输出的形式：输出在各种数目的随机数下，各种排序算法所用的时间和比较次数。(3) 程序所能达到的功能：该程序可以根据用户的输入而产生相应的随机数，然后对随机数进行

3、各种排序，根据排序进行时间和次数的比较。（4）测试数据：略二、概要设计1.抽象数据类型ADT List 数据对象 D ai | ai ElemSet, i=1,2,.,n, n0 数据关系 R1 |ai-1 ,aiD, i=2,.,n 基本操作 virtual void clear() = 0; bool insert(const Elem&) = 0; bool append(const Elem&) = 0; lbool remove(Elem&) = 0;void setStart() = 0; void setEnd() = 0; void prev() = 0; void next(

4、) = 0; int leftLength() const = 0; int rightLength() const = 0; bool setPos(int pos) = 0; bool getValue(Elem&) const = 0; void print() const = 0;2.程序的流程（1）输入模块：输入要排序的数的数量n（2）处理模块：系统产生n个随机数，对随机数进行排序（3）输出模块：将排序的结果输出3.算法的基本思想1、随机数的产生：利用srand()产生随机数。2、快速排序：选定一记录R，将所有其他记录关键字k与记录R的关键字k比较, 若 kk 则将记录换至

5、R之后，继续对R前后两部分记录进行快速排序，直至排序范围为13、插入排序：逐个处理待排序的记录，每个新记录与前面已排序的子序列进行比较，将它插入到子序列中正确的位置4、冒泡排序：比较并交换相邻的元素对，直到所有元素都被放到正确的地方为止。5、归并排序：将两个或者多个有序表归并成一个有序表6、堆排序：首先将数组转化为一个满足堆定义的序列，然后将堆顶的最大元素取出，再将剩下的数排成堆，再取堆顶数值，。如此下去，直到堆为空。到最后结束时，就排出了一个由小到大排列的数组。三、详细设计（1）产生随机数：直接调用函数srand(),以时间作为随机种子进行选择，并把随机数装入数组中 unsigned

6、 long int *Sort:setRan(unsigned long int num)unsigned long int *ra;ra=(unsigned long int*)malloc(num*sizeof(unsigned long int);srand(time(NULL);for(unsigned long int m=0;mnum;m+)ram=rand();coutendl;return ra;（2）快速排序：要实现快速排序首先选择一个轴值，这里选取数组第一个为轴值。定义两个标识low,high。high标识最后一个元素的位置，从后向前，将关键字与轴值比较，直至遇到小于轴值的

7、关键字，前移，low标识在第二个元素的位置，从前向后，将关键字与轴值比较，直至遇到大于轴值的关键字，后移。当low,high相遇后第一趟排序结束。调整数列，轴值左边的为比轴值小的，右边为比轴值大的。对轴值左边（即low到pivotkey-1的数）和右边的子列（pivotkey+1到high的数）分别进行上述递归快速排序，直到范围为1结束。int partition(int a,int low,int high)/快速排序中的一趟 int pivotkey; /作为枢轴来使用 pivotkey=alow; while(lowhigh) while(low=pivotkey) -high; alo

8、w=ahigh; while(lowhigh&alow=pivotkey) +low; ahigh=alow; alow=pivotkey; return low;void qsort(int a,int low,int high)/快速排序的递归形式 int pivotloc; if(lowsetNum();LARGE_INTEGER Freg;LARGE_INTEGER Count1,Count2;QueryPerformanceFrequency(&Freg);QueryPerformanceCounter(&Count1);/获取时间Count1double d;int temp,j;

9、for (unsigned long int i=0;igetRanNum();i+)j=i;temp=si;while (j=1 & tempSortNum+;if(j1)this-SortNum+;sj=temp;QueryPerformanceCounter(&Count2);/获取时间Count2d=(double)(Count2.QuadPart-Count1.QuadPart)/(double)Freg.QuadPart*1000.0;/计算时间差，d的单位为ms.cout插入排序算法对RanNum个随机数排序时间为为d ms.endl;cout插入排序算法对RanNum个随机数交

10、换次数为SortNum次。endl;(4) 冒泡排序（bubble sort）：将被排序的记录数组R1.n垂直排列，每个记录Ri看作是重量为Ri.key的气泡。根据轻气泡不能在重气泡之下的原则，从下往上扫描数组R：凡扫描到违反本原则的轻气泡，就使其向上飘浮。如此反复进行，直到最后任何两个气泡都是轻者在上，重者在下为止。从无序区底部向上依次比较相邻的两个气泡的重量，若发现轻者在下、重者在上，则交换二者的位置。即依次比较(Rn，Rn-1)，(Rn-1，Rn-2)，(R2，R1)；对于每对气泡(Rj+1，Rj)，若Rj+1.keysetNum();LARGE_INTEGER Freg;LARGE_I

11、NTEGER Count1,Count2;QueryPerformanceFrequency(&Freg);QueryPerformanceCounter(&Count1);/获取时间Count1double d;unsigned long int temp;for(unsigned long int i=0;iRanNum);i+)for(int j=i+1;jRanNum);j+)if(sisj)temp = si;si=sj;sj=temp;this-SortNum+; QueryPerformanceCounter(&Count2);/获取时间Count2d=(double)(Coun

12、t2.QuadPart-Count1.QuadPart)/(double)Freg.QuadPart*1000.0;/计算时间差，d的单位为ms.cout冒泡排序算法对RanNum个随机数排序时间为d ms.endl;cout冒泡排序算法对RanNum个随机数交换次数为SortNum次。endl; (5) 堆排序：堆排序与其他排序算法最大的区别是它依靠一种特殊的数据结构堆来进行排序。堆是一种完全二叉树，并且根节点不大于左右子树中的所有节点，ni=n2*i&ni=n2*i+1。因此堆排序算法首先要将给出的无序数组构造成一个堆，然后输出根节点（最小元素），将剩余元素重新恢复成堆，再次输出根节点。依

13、次类推，直至最后一个节点输出，此时堆排序完成。void Sort:heapRestor(unsigned long int *s,int i,int m) int ma;if(imin(s2*i,s2*i+1)if(s2*iheapRestor(s,2*i,m);elsema=si;si=s2*i+1;s2*i+1=ma;this-heapRestor(s,2*i+1,m);this-SortNum=this-SortNum+2;else if(iSortNum+;void Sort:heapCreat(unsigned long int *s,int m)int num;for(num=m/

14、2;num=1;num-)this-heapRestor(s,num,m);void Sort:heapSort(unsigned long int *s1,unsigned long int *s2)this-setNum();int i,num;num=this-RanNum;LARGE_INTEGER Freg;LARGE_INTEGER Count1,Count2;QueryPerformanceFrequency(&Freg);QueryPerformanceCounter(&Count1);/获取时间Count1double d;this-heapCreat(s1,this-Ran

15、Num);for(i=0;iRanNum;i+)s2i=s11;s11=s1num;this-heapRestor(s1,1,-num);QueryPerformanceCounter(&Count2);/获取时间Count2d=(double)(Count2.QuadPart-Count1.QuadPart)/(double)Freg.QuadPart*1000.0;/计算时间差，d的单位为ms.cout堆排序算法对RanNum个随机数排序时间为为d ms.endl;cout堆排序算法对RanNum个随机数交换次数为SortNum次。endl; (6) 合并排序：这里的合并排序和下边要描述的

16、快速排序都采用了分而治之的思想，但两者仍然有很大差异。合并排序是将一个无序数组n1r分成两个数组n1r/2与nr/2+1r，分别对这两个小数组进行合并排序，然后再将这两个数组合并成一个大数组。由此我们看出合并排序时一个递归过程（非递归合并排序这里不做讨论）。合并排序的主要工作便是“合并”，两个小规模数组合并成大的，两个大的再合并成更大的，当然元素比较式在合并的过程中进行的。void Sort:mergeSort(unsigned long int *s,int left,int right)int i;if(left right) i=(left + right)/2; mergeSort(s

17、,left, i); mergeSort(s, i + 1, right); Merge(s, left, i, right); int Sort:partition(unsigned long int *s,int low,int high)int key,i,p,r;p=low;r=high;key=sp;while(pp;i-)if(siSortNum+;break; r-;this-SortNum+;for(i=p;ikey)sr=sp;r-;this-SortNum+;break;p+;this-SortNum+;sp=key;return p;(7)基本操作 AList(int s

18、ize=DefaultListSize) maxSize = size; listSize = fence = 0; listArray = new ElemmaxSize; AList() delete listArray; 清空。释放数组，将数组大小和栅栏置0.void clear() delete listArray; listSize = fence = 0; listArray = new ElemmaxSize;将栅栏赋初值0，放在开头。void setStart() fence = 0; 将栅栏指向数组最后。void setEnd() fence = listSize; 获得当前

19、的位置。用栅栏的指向即可直接获得。void prev() if (fence != 0) fence-; 获得最大值的大小，由栅栏可直接获得。void next() if (fence = listSize) fence+; 返回当前位置左边的长度。直接返回栅栏的值获得。int leftLength() const return fence; 返回当前位置右边的长度。用最大长度减去当前栅栏的值。int rightLength() const return listSize - fence; 设置当前位置，将值直接赋予栅栏。bool setPos(int pos) if (pos = 0) &

20、(pos = 0) & (pos = listSize);返回当前的值。bool getValue(Elem& it) const if (rightLength() = 0) return false; else it = listArrayfence; return true; （4）算法的时空分析插入排序：直接插入排序算法必须进行n-1趟。最好情况下，即初始序列有序，执行n-1趟，但每一趟只比较一次，移动元素两次，总的比较次数是(n-1)，移动元素次数是2(n-1)。因此最好情况下的时间复杂度就是O(n)。最坏情况(非递增)下，最多比较i次，因此需要的比较次数是：所以，时间复杂度为O(n

21、2)。冒泡排序：当原始数据正向有序时，冒泡排序出现最好情况。此时，只需进行一趟排序，作n-1次关键字比较，因此最好情况下的时间复杂度是O(n)。当原始数据反向有序时，冒泡排序出现最坏情况。此时，需进行n-1趟排序，第i趟作(n-i)次关键字间的比较，并且需执行(n-i)次元素交换，所以，比较次数为：因此,最坏情况下的时间复杂度为O(n2)快速排序：如果每一次分划操作后，左、右两个子序列的长度基本相等，则快速排序的效率最高，其最好情况时间复杂度为O(nlog2n)；反之，如果每次分划操作所产生的两个子序列，其中之一为空序列，此时，快速排序效率最低，其最坏情况时间复杂度为O(n2)。如果选择左边第

22、一个元素为主元，则快速排序的最坏情况发生在原始序列正向有序或反向有序时。快速排序的平均情况时间复杂度为O(nlog2n)。堆排序：堆排序的时间，主要由建立初始堆和反复重建堆这两部分的时间开销构成，它们均是通过调用Heapify实现的。堆排序的最坏时间复杂度为O(nlogn)。堆排序的平均性能较接近于最坏性能。由于建初始堆所需的比较次数较多，所以堆排序不适宜于记录数较少的文件。堆排序是不稳定的，算法时间复杂度O(nlogn)。归并排序：在最佳、平均、最差情况下，时间复杂度为Q(n log n)，不足的就是需要两倍的空间代价，当输入的待排序数据存储在链表中时，归并排序是一个很好的选择.（5）函数的

23、调用关系图用户输入排序的元素个数n产生n个随机数主程序对随机数进行排序输出（6）输入和输出的格式输入请输入排序规模：/提示输入等待输入输出插入排序算法对n个随机数排序时间为插入排序算法对n个随机数交换次数为冒泡排序算法对n个随机数排序时间为冒泡排序算法对n个随机数交换次数为堆排序算法对n个随机数排序时间为堆排序算法对n个随机数交换次数为合并排序算法对n个随机数排序时间为合并排序算法对n个随机数交换次数为快速排序算法对n个随机数排序时间为快速排序算法对n个随机数交换次数为排序后，前50个有序元素为：四、用户使用说明（可选）1、本程序的运行环境为DOS操作系统，执行文件为

24、conversion.exe2、运行程序时输入请输入排序规模：/提示输入等待输入输出插入排序算法对n个随机数排序时间为插入排序算法对n个随机数交换次数为冒泡排序算法对n个随机数排序时间为冒泡排序算法对n个随机数交换次数为堆排序算法对n个随机数排序时间为堆排序算法对n个随机数交换次数为合并排序算法对n个随机数排序时间为合并排序算法对n个随机数交换次数为快速排序算法对n个随机数排序时间为快速排序算法对n个随机数交换次数为排序后，前50个有序元素为：五：实现图1 控制台程序实验结果：实验分别实现插入排序、冒泡排序、堆排序、合并排序、快速排序，以不同规模（100，1000，2

25、000，5000，10000，100000个数据）的随机数作为测试数据集，实验结果截图如下：排序规模为100排序规模为：1000排序规模为：2000排序规模为：5000排序规模为：10000排序规模为：100000（六）算法性能分析在程序中我们根据数据规模的不同产生不同的随机整型数组，然后分别让不同的排序算法来进行从小到大的排序。这里需要注意的是：每种排序算法在相同的输入规模中原始无序数据都是一样的。例如五种排序算法要对长度为100的无序数组进行排序，它们所要排序的无序数组都是一样的，我们以此来保证实验的公正性。在这里我们认为比较次数是排序算法的主要操作，因此我们在每个排序算法中加入计数器来记

26、录排序过程中的比较次数，以此来作为对算法性能分析的主要参数（排序时间作为辅助参数）。表1为在输入规模分别为100，1000，2000，5000，10000，100000时各个算法的元素交换次数。表2为在输入规模分别为100，1000，2000，5000，10000，100000时各个算法的排序时间。排序规模（n）算法10010002000500010000100000插入排序27822462559832116266052248708162509250617冒泡排序26842420119631585956790224520141127169842堆排序10001648037063106026

27、2319032985016合并排序555871919432553011204091536596快速排序5991037723702714311528791946925表1 排序算法比较次数性能比较排序规模（n）算法10010002000500010000100000插入排序0.04523.058312.126358.2854177.5416694冒泡排序0.10079.4697621.3535133.777526.97142698.7堆排序0.07370.5794671.284443.595778.03182102.961合并排序0.37092.191434.1192511.679420.8

28、016192.61快速排序0.03350.2029530.4287681.31712.6953129.9569表2 排序算法排序时间比较（单位ms）为了直观起见，根据实验数据画出各种排序算法在不同输入规模下交换次数的变化趋势图如图2所示：图2排序算法交换次数趋势图由上图我们基本上看出插入排序和冒泡排序的比较次数随输入规模的呈非线性增长，而后三种排序方法堆排序，合并排序，快速排序的比较次数随输入规模的增长基本呈线性变化趋势。根据实验数据画出各种排序算法在不同输入规模下交换次数的变化趋势图如图3所示：图3排序算法排序时间趋势图（单位：ms）实验结果与我们对这五种算法的性能理论分析基本吻合：插入排序

29、与冒泡排序的时间复杂度为O(n*n)，而后三种排序算法的时间复杂度为O(nlogn)。图4还显示出虽然冒泡排序和插入排序的时间复杂度相同，但插入排序的性能仍然比冒泡排序好，尤其在排序时间方面。（七）结论最后得出结论：时间性能上，快速排序堆排序合并排序插入排序冒泡排序交换次数上，合并排序快速排序堆排序冒泡排序插入排序(八)心得作为拿来复习的一个报告还是蛮有成就感的，但是输入1000000个数据的时候等得太久，实在等不出结果，而且放入值太大不方便作图，于是就不参与数据分析，但是估计结果应该相同。以前不懂排序只会用冒泡，因为冒泡排序是接触编程的第一个排序，印象很深刻，而且几乎不会用

30、错，当数据比较大时它的弊端就真的出现了。本以为这个实验还是比较好做的，排序几乎都会，连助教都说一句你这个选题太没难度了。但是平心而论，真正实现起来还真是问题多多，首先是怎么样调用时间的问题，这也是第一个先想的问题，本来打算就只比较交换次数和比较次数的，但是这些其实没有比时间更直观的反应排序的效率。寻找半天无果本来都打算放弃了，结果竟然有一个回复贴说QueryPerformanceCounter函数，于是就发现这个问题可以解决了。结果是想象的有点偏差，没想到堆排序的速度也能这么快，合并排序的次数会那么少。本以为快速排序就是万能的了，看来想多了。或许以后在研究算法方面的确需要好好分析效率，数据结构的确是一门很有用的学科，以后不能丢弃。

展开阅读全文