
CUDA编程
Swocky
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【CUDA编程】学习笔记(一) Hello CUDA
前言本系列博客做为CUDA编程学习的笔记,因为最近比较忙,内容从简,只做一些大体的记录。作为初学者,错误之处还请见谅。原创 2019-05-30 19:36:06 · 1512 阅读 · 0 评论 -
【CUDA编程】学习笔记(二) GPU硬件架构
一、CPU与GPU的链接模型在计算机的硬件架构中,CPU与GPU有多种链接模式,下面介绍几种典型的架构北桥多CPU(SMP)多CPU(NUMA)多CPU(NUMA)多总线具有集成PCI Express的多CPU集成GPU集成GPU与独立GPU多个插槽中的GPU多GPU板简化了CPU / GPU架构下面这张图是各代GPU架构的迭代顺序,目前最新的架构是Tu...原创 2019-05-31 11:23:34 · 890 阅读 · 0 评论 -
【CUDA编程】学习笔记(四) GPU存储与优化
一、CPU内存●现代计算机体系结构面临的主要挑战✓如果数据无法快速移入和移出,那么快速计算将毫无意义✓需要大量内存用于大型应用程序✓非常快的内存也非常昂贵●最终被推向分层设计(1)CPU内存层次结构●执行速度依赖于利用数据局部性✓时间局部性:刚刚访问的数据项很可能在不久的将来再次使用,因此请将其保留在缓存中✓空间局部性:相邻数据也可能很快被使用,因此加载 它们使用“宽”总线(如...原创 2019-06-06 19:59:53 · 1344 阅读 · 0 评论 -
【CUDA编程】学习笔记(三) CUDA软件抽象机制
一、多线程(1)设计理念CPU是面向延迟的核心,尽可能快完成计算任务GPU是面向吞吐量的核心,通过多个线程实现在某一段时间内的高吞吐率打个比喻,前者是一架飞机,后者是一千辆牛车可以看到,CPU的Cache更大,通过复杂的控制逻辑实现性能优化,而GPU的控制逻辑相对简单,通过多线程来实现高吞吐率(2)多线程CPU中的SIMD✓所有内核同时执行相同的指令,但数据不同✓类似于CRAY...原创 2019-06-03 10:15:11 · 699 阅读 · 0 评论