Chap2 性能评测和并行编程 性能评测 并行编程 为什么需要三次 `barrier` 改进方法 Chap3 互连网络 交换和路由 二维网格中 XY 路由 死锁、活锁及饿死 死锁避免的方法:虚通道、转弯模型 二维网格中最小 西向优先、北向最后和负向优先算法 转弯模型:超立方体的部分自适应路由算法(P立方路由) 互连网络 Omega 网络 地址映射 阻塞条件 自路由标记 蝶形 MIN 网络 立方体 MIN 网络 XY 多播路由模式 Chap4 对称多处理机系统 SMP 的特点 扩展 SMP 高速缓存一致性 总线侦听 侦听协议 MSI MESI Dragon 顺序一致性 Chap6 机群系统 Chap2 性能评测和并行编程 性能评测 作业题会用到,考试没考过。 C P I = 执行整个程序所需的时钟周期数 程序中指令总数 CPI = \frac{执行整个程序所需的时钟周期数}{程序中指令总数} CPI=