1 想法
难啃的东西
双调归并的核心思想是两段连续数组经过一个操作,合并为一个,性质不变。说起来简单,实际步骤会比较困难,因为涉及许多边界条件确定,复杂的升序和降序控制。
2 原理解释
2.1 双调归并排序
包含两个部分:如何双调归并,如何排序。
图1中,同字母索引的相互比较交换。
图2中,BM使得该区域变成尖尖对应的排序方式(升序/降序),逐渐变到最后。
Question:排序深度是否是log的平方?
3 代码
多block版本很复杂
3.1 单block版本
唯一需要注意的,是为什么2*threadIdx.x-(threadIdx.x & (stride-1))能将线程映射到对应的位置。你可以自己写一个对应关系看看。
// 交换器
__device__ void comparator(ELEM_TYPE &A, ELEM_TYPE &B, uint dir) {
ELEM_TYPE t;
// 交换各自独立
if ((A>B) == dir) { // dir=1就是升序
t=A; A=B; B=t;
}
}
// 单block双调排序
__global__ void bitonicSort_singleBlock(E