函数的image参数始终位于全局地址空间中
work-item内部内存操作有可预测的顺序:即任意两个对同一地址的读和写操作是不会被硬件或者编译器重新排序
在同一个work-group的不同work-item之间,只在barrier 操作处保证内存一致性
在work-group之间,在kernel执行完成前,不保证内存一致性。
kernel 打印需加头
#pragma OPENCL EXTENSION cl_amd_printf : enable
我发现加这个头的时候 在kernel里边打印多个变量时 只有第一个变量的值被打印出来,其他的都是0
(环境是 win7 sdk2.8 vs10)
bufffer 没赋值的时候是0