盖世灬英雄z-CSDN博客

原创 SOC中transaction的延迟和AT model实现方法

我们来详细分解在一个 SoC 中，硬件 Master 通过 NoC (Network-on-Chip) 到达 Target 需要经过的 latency，以及在 TLM-2.0 AT (Approximately Timed) 建模中这些 latency 通常对应哪些阶段的。是 AT 建模的关键特征，它允许在较高的抽象层次上进行精确的时序分析，同时保持了模型的松散耦合。是一个累计的、可修改的参数，在事务的不同阶段和模块间传递时，它会被不断更新和累加。，即从当前时间点算起，事务的下一个阶段预计何时发生。

2025-06-11 10:36:51 311

原创 VDK中接收memcpy传递结构体时，interface被访问多次问题

问题现象：在VDK软件中，SDMA接受从SCP/AP侧发来的命令帧后自动解析命令帧，然后执行相应操作，但是在使用SCP 给 SDMA发送命令帧时，发现SDMA的回调调用了多次，因此查看反汇编出来的代码，是否给SDMA的interface发送了多次的transaction，造成了回调调用多次。猜测：memcpy时，是多次transaction需要调试的sdma代码如下最关键的部分来了。

2025-05-21 17:22:47 794

原创 AI芯片中得训练任务和推理任务在底层得差异

大模型在训练和**推理（推断）**阶段使用 AI 芯片时，虽然整体流程类似，但目标、资源使用、底层算子实现上都有显著差异。下面我给你分点详细讲一下它们的区别

2025-04-23 16:14:41 866

原创 NPU的编程模型和数据流驱动使用方法

NPU的编程模型从顶层到底层分为Dataflow programming model、High-Level Programming model、Low-level programming model、CT Kernel programming

2025-04-17 15:04:39 745

原创 c++模板高阶使用技巧

C++模板高级使用技巧

2025-04-16 17:21:16 591

原创在模板函数中调用模板类中的方法

这样你就可以在模板函数中灵活调用模板类的各种方法了。

2025-04-15 10:32:16 286

原创 vector迭代器的几种用法

在c++中vector迭代器的几种用法

2025-04-14 20:59:17 266

原创 tlm_quantumkeeper如何理解

用时间轴来分析一下这个时间，（两个init都只发了5次transaction）

2025-04-11 17:29:39 350 2

原创 C++面向对象编程，组合优于继承

面向对象编程中，组合优于继承的理解

2025-04-08 19:48:01 871

原创芯片算力的计算方式

算力=操作数×主频×并行单元=1×109×16,384=16.384 TOPS算力 = 操作数 \times 主频 \times 并行单元 = 1 \times 10^9 \times 16,384 = 16.384 \, \text{TOPS}算力的计算与芯片的硬件架构、数据类型支持、以及工作频率密切相关。算力=2×1.41 GHz×6912=19.5 TFLOPS算力 = 2 \times 1.41 \, \text{GHz} \times 6912 = 19.5 \, \text{TFLOPS}

2025-01-21 20:28:40 1132