双核CPU上的快速排序效率

[复制链接]
查看11 | 回复4 | 2012-5-21 10:19:41 | 显示全部楼层 |阅读模式
双核CPU上的快速排序效率
为了试验一下多核CPU上排序算法的效率,得比较单任务情况下和多任务并行排序算法的差距,因此选用快速排序算法来进行比较。
测试环境:双核CPU 2.66GHZ

单核CPU 2.4GHZ

以下是一个快速排序算法的源代码:
UINTSplit(void **ppData, UINTuStart, UINTuEnd,
COMPAREFUNCCompareFunc){
void *pSelData;
UINTuLow;
UINTuHigh;
uLow = uStart;
uHigh = uEnd;
pSelData = ppData[uLow];
while ( uLow0
&& uLow != uHigh ){
--uHigh;}
if ( uHigh != uLow ){
ppData[uLow] = ppData[uHigh];
++uLow;}
while ( (*CompareFunc)( ppData[uLow], pSelData )uStart ){
QuickSort(ppData, uStart, uMid - 1, CompareFunc);}
if ( uEnd > uMid ){
QuickSort(ppData, uMid + 1, uEnd, CompareFunc); }}
先测试一下这个快速排序算法排一百万个随机整数所花的时间:
voidTest_QuickSort(void){
UINTi;
UINTuCount = 1000000; //1000000个
srand(time(NULL));
void **pp = (void **)malloc(uCount * sizeof(void *));
for ( i = 0; i0 ){
u1 = uStart;
u2 = uEnd;
v1 = uStart2;
v2 = uEnd2;
pp1 = ppData;
pp2 = ppData2;}
else{
u1 = uStart2;
u2 = uEnd2;
v1 = uStart;
v2 = uEnd;
pp1 = ppData2;
pp2 = ppData;}
k = 0;
pp[k] = pp1[u1];
j = v1;
for (i = u1+1; i ppData, pNode->uStart, pNode->uEnd, pNode->func);
return 1;}
#define THREAD_COUNT4
INTMQuickSort(void **ppData, UINTuStart, UINTuEnd, COMPAREFUNCCompareFunc){
void **pp1;
void **pp2;
void **pp3;
INT
i;
SORTNODE
Node[THREAD_COUNT];
HANDLE
hThread[THREAD_COUNT];
INT
nRet = CAPI_FAILED;
for ( i = 0; i < THREAD_COUNT; i++) {
Node.ppData = ppData;
if ( i == 0 )
{
Node.uStart = uStart;
}
else
{
Node.uStart = uEnd * i /THREAD_COUNT + 1;
}
Node.uEnd = uEnd *(i+1) / THREAD_COUNT;
Node.func = CompareFunc;
hThread = CreateThread(NULL, 0, QuickSort_Thread, &(Node), 0, NULL); }
for ( i = 0; i < THREAD_COUNT; i++ ) {
WaitForSingleObject(hThread, INFINITE); }

pp1 = Merge(ppData, uStart, uEnd/4, ppData, uEnd/4+1, uEnd/2, CompareFunc);
pp2 = Merge(ppData, uEnd/2+1, uEnd*3/4, ppData, uEnd*3/4+1, uEnd, CompareFunc);
if ( pp1 != NULL && pp2 != NULL ){
pp3 = Merge(pp1, 0, uEnd/2-uStart, pp2, 0, uEnd - uEnd/2 - 1, CompareFunc);
if ( pp3 != NULL ){
UINTi;
for ( i = uStart; i <= uEnd; i++)
{
ppData = pp3[i-uStart];
}
free(pp3);
nRet = CAPI_SUCCESS;}}
if( pp1 != NULL){
free( pp1 );}
if ( pp2 != NULL ){
free( pp2 );}
returnnRet;}
用下面程序来测试一下排1百万个随机整数的花费时间:
voidTest_MQuickSort (void){
UINTi;
UINTuCount = 1000000; //1000个
srand(time(NULL));
void **pp = (void **)malloc(uCount * sizeof(void *));
for ( i = 0; i < uCount; i++ ){
pp = (void *)(rand() % uCount);}
clock_tt1 = clock();
INTnRet = MQuickSort(pp, 0, uCount-1, UIntCompare);
clock_tt2 = clock();
printf("MQuickSort 1000000 Time %ld\n", t2-t1);
free(pp);}
在双核CPU上运行后,打印出花费的时间为 234 ms , 单任务版的快速排序函数约需406ms左右,并行运行效率为:406/(2×234) = 86.7% 左右。运行速度快了172ms。
可见双核CPU中,多任务程序速度还是有很大提高的。
当然上面的多任务版的快速排序程序还有很大的改进余地,当对4个区间排好序后,后面的归并操作都是在一个任务里运行的,对整体效率会产生影响。估计将程序继续优化后,速度还能再快一些。
发表于 @ 2006年08月23日 20:38:00|评论(5 )|编辑|收藏
回复

使用道具 举报

千问 | 2012-5-21 10:19:41 | 显示全部楼层
有创意哈。
回复

使用道具 举报

千问 | 2012-5-21 10:19:41 | 显示全部楼层



不错!
回复

使用道具 举报

千问 | 2012-5-21 10:19:41 | 显示全部楼层
有见地
不错
回复

使用道具 举报

千问 | 2012-5-21 10:19:41 | 显示全部楼层
双核在计算上的威力
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

主题

0

回帖

4882万

积分

论坛元老

Rank: 8Rank: 8

积分
48824836
热门排行