CUDA DEMO
时间: 2025-04-29 09:54:29 浏览: 15
### CUDA 示例程序
CUDA 提供了一系列官方示例来帮助开发者理解和使用其功能。这些例子通常位于安装目录下的 `Nsight Compute-<version>/help/html/CUDA_Samples/` 文件夹中[^1]。
对于希望快速上手 CUDA 编程的开发人员来说,可以从简单的向量加法开始:
```cpp
// Vector addition example
#include <stdio.h>
__global__
void add(int n, float *x, float *y)
{
int index = threadIdx.x;
int stride = blockDim.x;
for (int i = index; i < n; i += stride)
y[i] = x[i] + y[i];
}
int main(void)
{
int N = 1 << 20;
float *x, *y;
// Allocate Unified Memory – accessible from CPU or GPU
cudaMallocManaged(&x, N*sizeof(float));
cudaMallocManaged(&y, N*sizeof(float));
for (int i = 0; i < N; i++) {
x[i] = 1.0f;
y[i] = 2.0f;
}
// Launch kernel on GPU with N threads
add<<<1, 256>>>(N, x, y);
// Wait for GPU to finish before accessing on host
cudaDeviceSynchronize();
// Free memory
cudaFree(x);
cudaFree(y);
return 0;
}
```
此代码展示了如何定义并调用一个执行矢量相加操作的 CUDA 内核函数。值得注意的是,在实际应用中应当加入错误处理逻辑以及更复杂的内存管理机制[^3]。
除了上述基础案例外,还有更多高级主题的例子可供研究,比如图像处理、稀疏矩阵乘法等。为了方便学习者获取完整的源码及其说明文档,英伟达提供了专门的学习资源网站和 GitHub 仓库链接[^2]。
阅读全文
相关推荐


















