CUDA编程练习(十二) 双调归并排序

1 想法

难啃的东西

双调归并的核心思想是两段连续数组经过一个操作,合并为一个,性质不变。说起来简单,实际步骤会比较困难,因为涉及许多边界条件确定,复杂的升序和降序控制。

2 原理解释

2.1 双调归并排序

包含两个部分:如何双调归并,如何排序。

图1中,同字母索引的相互比较交换。

图2中,BM使得该区域变成尖尖对应的排序方式(升序/降序),逐渐变到最后。

Question:排序深度是否是log的平方?

3 代码

多block版本很复杂

3.1 单block版本

唯一需要注意的,是为什么2*threadIdx.x-(threadIdx.x & (stride-1))能将线程映射到对应的位置。你可以自己写一个对应关系看看。

// 交换器
__device__ void comparator(ELEM_TYPE &A, ELEM_TYPE &B, uint dir) {
    ELEM_TYPE t;
    // 交换各自独立
    if ((A>B) == dir) {  // dir=1就是升序
        t=A; A=B; B=t;
    }
}
// 单block双调排序
__global__ void bitonicSort_singleBlock(E
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值