在日常深度学习和科学计算中,使用图形处理器(GPU)进行加速是一个常见的做法。CUDA (Compute Unified Device Architecture) 是英伟达公司提供的用于GPU编程的平台和编程模型。同时它是一种并行计算模型,允许开发人员使用标准C语言对GPU进行编程,也就是对c语言的一种扩充写法。CUDA的核心思想是将任务分解为多个线程,并在GPU上同时执行这些线程。GPU由多个处理器和全局内存组成,每个处理器可以执行多个线程,同时访问全局内存。通过并行执行多个线程,可以大大提高计算速度。学习参考链接:https://docs.nvidia.com/cuda/cuda-c-programming-guide/
(1)CUDA编程模型
》 学习CUDA编程模型的基础知识:
-
Grids(网格):
- 网格是 CUDA