tatic inline std::shared_ptr<T> MakeShared(Args &&... args) { try { return std::make_shared<T>(std::forward<Args>(args)...); } catch (...) { return nullptr; } } 代码解析
时间: 2024-04-20 10:25:32 浏览: 159
这段代码是一个模板函数的实现,用于创建一个指定类型的`std::shared_ptr`对象。
具体解析如下:
1. `static inline std::shared_ptr<T> MakeShared(Args &&... args)`:函数模板的定义,函数名为`MakeShared`,返回类型为`std::shared_ptr<T>`,参数列表中使用了可变模板参数`Args &&...`,表示可以接受任意数量的参数。
2. `try { ... } catch (...) { ... }`:使用异常处理机制来捕获可能发生的异常。
3. `return std::make_shared<T>(std::forward<Args>(args)...);`:在`try`块中,调用`std::make_shared`函数来创建一个指定类型`T`的`std::shared_ptr`对象。`std::forward<Args>(args)...`用于将参数列表中的参数以完美转发的方式传递给构造函数。
4. `return nullptr;`:在`catch`块中,如果发生异常,则返回`nullptr`,表示创建`std::shared_ptr`失败。
总体来说,这个函数模板可以通过调用`std::make_shared`来创建一个指定类型的`std::shared_ptr`对象,并在创建过程中捕获可能的异常。如果创建成功,则返回创建的对象的指针;如果创建失败,则返回`nullptr`。
相关问题
对上述代码进行如下修改,是否改变基本功能:tatic int process(int8_t* input, int point_cnt, int height, int width, int stride, std::vector<float>& boxes, std::vector<float>& objProbs, std::vector<int>& classId, float threshold, int32_t zp, float scale) { int validCount = 0; float thres = unsigmoid(threshold); int8_t thres_i8 = qnt_f32_to_affine(thres, zp, scale); for (int a = 0; a < point_cnt; a++){ int8_t maxClassProbs = 0; int maxClassId = 0; for (int k = 1; k < OBJ_CLASS_NUM; ++k) { int8_t prob = input[(3+k) * point_cnt + a]; if (prob > maxClassProbs) { maxClassId = k; maxClassProbs = prob; } } if (maxClassProbs >= thres_i8) { int8_t rx = input[0 * point_cnt + a]; int8_t ry = input[1 * point_cnt + a]; int8_t rw = input[2 * point_cnt + a]; int8_t rh = input[3 * point_cnt + a]; float box_x = sigmoid(deqnt_affine_to_f32(rx, zp, scale)) * 2.0 - 0.5; float box_y = sigmoid(deqnt_affine_to_f32(ry, zp, scale)) * 2.0 - 0.5; float box_w = sigmoid(deqnt_affine_to_f32(rw, zp, scale)) * 2.0; float box_h = sigmoid(deqnt_affine_to_f32(rh, zp, scale)) * 2.0; objProbs.push_back(sigmoid(deqnt_affine_to_f32(maxClassProbs, zp, scale))); classId.push_back(maxClassId); validCount++; boxes.push_back(box_x); boxes.push_back(box_y); boxes.push_back(box_w); boxes.push_back(box_h); } } return validCount; } int post_process(int8_t* input0, int model_in_h, int model_in_w, float conf_threshold, float nms_threshold, float scale_w, float scale_h, std::vector<int32_t>& qnt_zps, std::vector<float>& qnt_scales, detect_result_group_t* group) { static int init = -1; if (init == -1) { int ret = 0; ret = loadLabelName(LABEL_NALE_TXT_PATH, labels); if (ret < 0) { return -1; } init = 0; } memset(group, 0, sizeof(detect_result_group_t)); std::vector<float> filterBoxes; std::vector<float> objProbs; std::vector<int> classId; // stride 6 int stride0 = 4 + OBJ_CLASS_NUM; int point_cnt = 8400; int validCount0 = 0; validCount0 = process(input0, point_cnt, model_in_h, model_in_w, stride0, filterBoxes, objProbs, classId, conf_threshold, qnt_zps[0], qnt_scales[0]); int validCount = validCount0; // no object detect if (validCount <= 0) { return 0; } std::vector<int> indexArray; for (int i = 0; i < validCount; ++i) { indexArray.push_back(i); } quick_sort_indice_inverse(objProbs, 0, validCount - 1, indexArray); std::set<int> class_set(std::begin(classId), std::end(classId)); for (auto c : class_set) { nms(validCount, filterBoxes, classId, indexArray, c, nms_threshold); } int last_count = 0; group->count = 0; /* box valid detect target */ for (int i = 0; i < validCount; ++i) { if (indexArray[i] == -1 || last_count >= OBJ_NUMB_MAX_SIZE) { continue; } int n = indexArray[i]; float x1 = filterBoxes[n * 4 + 0]; float y1 = filterBoxes[n * 4 + 1]; float x2 = x1 + filterBoxes[n * 4 + 2]; float y2 = y1 + filterBoxes[n * 4 + 3]; int id = classId[n]; float obj_conf = objProbs[i]; group->results[last_count].box.left = (int)(clamp(x1, 0, model_in_w) / scale_w); group->results[last_count].box.top = (int)(clamp(y1, 0, model_in_h) / scale_h); group->results[last_count].box.right = (int)(clamp(x2, 0, model_in_w) / scale_w); group->results[last_count].box.bottom = (int)(clamp(y2, 0, model_in_h) / scale_h); group->results[last_count].prop = obj_conf; char* label = labels[id]; strncpy(group->results[last_count].name, label, OBJ_NAME_MAX_SIZE); // printf("result %2d: (%4d, %4d, %4d, %4d), %s\n", i, group->results[last_count].box.left, // group->results[last_count].box.top, // group->results[last_count].box.right, group->results[last_count].box.bottom, label); last_count++; } group->count = last_count; return 0; }
对于第一个修改的代码块 `static int process(int8_t* input, int point_cnt, int height, int width, int stride,
std::vector<float>& boxes, std::vector<float>& objProbs, std::vector<int>& classId, float threshold,
int32_t zp, float scale)`,基本功能并没有改变。该函数仍然实现了目标检测的后处理,根据输入的 int8_t 类型指针和相关参数,提取有效的目标检测结果,并将检测框的位置、大小、目标置信度和类别编号存储在相应的向量中。
第二个修改的代码块 `int post_process(int8_t* input0, int model_in_h, int model_in_w, float conf_threshold,
float nms_threshold, float scale_w, float scale_h, std::vector<int32_t>& qnt_zps,
std::vector<float>& qnt_scales, detect_result_group_t* group)`,基本功能也没有改变。该函数仍然实现了目标检测的后处理,根据输入的特征图和相关参数,提取有效的目标检测结果,并将检测框的位置、大小、目标置信度和类别信息存储在 `detect_result_group_t` 结构体中。
两个修改的代码块主要对输入参数进行了调整,其中 `point_cnt` 表示检测点的数量,通过调整 `stride0` 的计算方式来确定。这些修改可能是为了适应不同的检测模型或数据集,但并没有改变基本的目标检测后处理逻辑。
linux内核函数rate = clk_round_rate(d->clk, baud * 16)是如何实现动态调整时钟的,源码如下: long clk_round_rate(struct clk *clk, unsigned long rate) { struct clk_rate_request req; int ret; if (!clk) return 0; clk_prepare_lock(); clk_core_get_boundaries(clk->core, &req.min_rate, &req.max_rate); req.rate = rate; ret = clk_core_round_rate_nolock(clk->core, &req); clk_prepare_unlock(); if (ret) return ret; return req.rate; } EXPORT_SYMBOL_GPL(clk_round_rate); static void clk_core_get_boundaries(struct clk_core *core, unsigned long *min_rate, unsigned long *max_rate) { struct clk *clk_user; *min_rate = core->min_rate; *max_rate = core->max_rate; hlist_for_each_entry(clk_user, &core->clks, clks_node) *min_rate = max(*min_rate, clk_user->min_rate); hlist_for_each_entry(clk_user, &core->clks, clks_node) *max_rate = min(*max_rate, clk_user->max_rate); } tatic int clk_core_round_rate_nolock(struct clk_core *core, struct clk_rate_request *req) { struct clk_core *parent; long rate; lockdep_assert_held(&prepare_lock); if (!core) return 0; parent = core->parent; if (parent) { req->best_parent_hw = parent->hw; req->best_parent_rate = parent->rate; } else { req->best_parent_hw = NULL; req->best_parent_rate = 0; } if (core->ops->determine_rate) { return core->ops->determine_rate(core->hw, req); } else if (core->ops->round_rate) { rate = core->ops->round_rate(core->hw, req->rate, &req->best_parent_rate); if (rate < 0) return rate; req->rate = rate; } else if (core->flags & CLK_SET_RATE_PARENT) { return clk_core_round_rate_nolock(parent, req); } else { req->rate = core->rate; } return 0; }
<think>嗯,我现在需要理解Linux内核中的clk_round_rate函数是如何动态调整时钟的。首先,我应该先看一下用户提供的代码片段,然后逐步分析每个函数的作用。
首先,clk_round_rate函数接收一个时钟结构体clk和一个目标速率rate。它的主要作用是返回该时钟可以设置到的最接近目标速率的实际速率。这个过程可能需要考虑时钟的约束条件,比如最小和最大速率限制,以及可能的父时钟的影响。
接下来,函数内部定义了一个clk_rate_request结构体req,用来保存请求的速率以及相关参数。然后检查clk是否有效,如果无效,直接返回0。接着,函数通过clk_prepare_lock()获取锁,确保在操作期间不会有并发问题。
然后调用clk_core_get_boundaries函数,这里传入clk->core和req的min_rate和max_rate指针。这个函数的作用是获取该时钟核心的最小和最大速率限制。在clk_core_get_boundaries中,首先将core的min_rate和max_rate赋值给传入的指针。然后遍历所有使用该核心的clk用户(通过hlist_for_each_entry),将用户中的最大min_rate作为整体的最小速率,最小的max_rate作为整体的最大速率。这可能是因为每个用户可能有自己的限制,整体的限制是它们的交集。
接下来,clk_round_rate设置req的rate为传入的目标速率,并调用clk_core_round_rate_nolock来处理具体的速率计算。这个函数会尝试找到最接近目标的有效速率。
在clk_core_round_rate_nolock中,首先检查是否有父时钟,如果有,将父时钟的当前速率作为最佳父速率。然后根据时钟核心的操作函数来决定如何计算合适的速率。这里有三种情况:
1. 如果时钟驱动提供了determine_rate回调函数,则直接调用它。这个函数通常会根据硬件的能力和父时钟的限制来确定最佳速率。
2. 如果没有determine_rate但有round_rate回调,就调用这个函数,传入目标速率和父速率。这里可能会调整父速率,并返回一个可行的子时钟速率。如果返回负数,说明出错,否则将结果保存到req->rate。
3. 如果前两个回调都不存在,但设置了CLK_SET_RATE_PARENT标志,则递归调用自身来处理父时钟,调整父时钟的速率,从而间接影响当前时钟的速率。
4. 如果以上都不满足,就直接使用当前时钟的固定速率,不进行调整。
处理完成后,解锁并返回最终的req->rate。
用户提到的例子是rate = clk_round_rate(d->clk, baud * 16)。这里可能是在串口驱动中,需要根据波特率baud计算出所需的时钟频率(通常是波特率的16倍)。通过这个函数,内核可以找到一个最接近且硬件支持的时钟频率,确保通信的稳定。
另外,需要注意的是,clk_round_rate并不会实际改变时钟频率,它只是查询可能的速率。实际设置频率可能需要调用clk_set_rate函数。
整个过程中,锁的机制确保了在计算速率时不会有并发修改的问题。同时,考虑父时钟的影响使得时钟树的结构能够被正确地处理,特别是在需要调整父时钟的情况下(比如某些PLL配置)。
不过,这里可能存在一个疑问:当存在多个用户时,clk_core_get_boundaries如何确保整体的min和max是正确的?比如,每个用户的min_rate可能不同,取最大的那个作为整体的min_rate,这样所有用户的min限制都能被满足。类似地,max_rate取最小的,确保不超过任何用户的max限制。这应该能保证最终的速率在所有用户的允许范围内。
此外,递归调用父时钟的处理可能涉及复杂的时钟树遍历,需要确保不会出现循环或者死锁的情况。不过,在内核中通常会有良好的设计和约束来避免这些问题。
总结一下,clk_round_rate的工作流程是:获取时钟的速率限制,然后通过驱动提供的回调函数或父时钟的调整,找到最接近目标的有效速率。整个过程需要考虑硬件限制、用户约束以及时钟树的结构。</think>Linux内核中的`clk_round_rate`函数用于动态确定时钟信号可设置的最接近目标值的实际频率。以下是其实现原理的逐步分析:
---
### **1. 函数入口与基本检查**
```c
long clk_round_rate(struct clk *clk, unsigned long rate) {
struct clk_rate_request req;
// 检查时钟有效性,无效则返回0
if (!clk) return 0;
clk_prepare_lock(); // 加锁防止并发操作
// ...
}
```
- **作用**:验证输入时钟有效性,并通过`clk_prepare_lock()`加锁保证线程安全。
---
### **2. 获取时钟频率边界**
```c
clk_core_get_boundaries(clk->core, &req.min_rate, &req.max_rate);
```
- **内部逻辑**:
- 从`clk->core`读取默认的`min_rate`和`max_rate`。
- 遍历所有使用该时钟的**用户**(`clk_user`),取所有用户中**最大的`min_rate`**和**最小的`max_rate`**。
- **目标**:确保最终频率满足所有用户的约束条件。
---
### **3. 核心频率计算逻辑**
调用`clk_core_round_rate_nolock`,具体步骤如下:
#### **3.1 确定父时钟参数**
```c
parent = core->parent;
if (parent) {
req->best_parent_hw = parent->hw;
req->best_parent_rate = parent->rate;
}
```
- 若存在父时钟,记录其当前速率(`parent->rate`),用于后续计算。
#### **3.2 选择频率计算策略**
根据时钟驱动支持的回调函数,分三种情况处理:
##### **情况1:驱动实现`determine_rate`**
```c
if (core->ops->determine_rate) {
return core->ops->determine_rate(core->hw, req);
}
```
- **作用**:由驱动直接根据硬件能力、父时钟限制等返回最佳速率。
- **适用场景**:复杂时钟源(如PLL),需精确计算分频/倍频参数。
##### **情况2:驱动实现`round_rate`**
```c
else if (core->ops->round_rate) {
rate = core->ops->round_rate(core->hw, req->rate, &req->best_parent_rate);
req->rate = rate;
}
```
- **作用**:驱动返回一个最接近目标的可行速率,并可调整父时钟速率(如需要)。
##### **情况3:依赖父时钟调整(`CLK_SET_RATE_PARENT`)**
```c
else if (core->flags & CLK_SET_RATE_PARENT) {
return clk_core_round_rate_nolock(parent, req);
}
```
- **作用**:递归调用父时钟的频率计算函数,通过调整父时钟间接影响当前时钟。
- **适用场景**:当前时钟无法独立调整,需依赖父时钟(如分频器)。
##### **默认情况:使用固定速率**
```c
else {
req->rate = core->rate; // 直接返回当前速率
}
```
---
### **4. 返回计算结果**
```c
clk_prepare_unlock();
return req.rate;
```
- 释放锁并返回计算得到的最佳速率。
---
### **动态调整的典型场景**
以用户提供的`clk_round_rate(d->clk, baud * 16)`为例:
- **目标**:为串口通信生成16倍波特率的时钟(满足采样需求)。
- **过程**:
1. 计算目标频率:`baud * 16`。
2. 通过`clk_round_rate`确定实际支持的最近频率(考虑硬件约束、用户限制、父时钟能力)。
3. 实际设置频率需调用`clk_set_rate`。
---
### **关键设计点**
1. **约束聚合**:通过`clk_core_get_boundaries`确保所有用户的`min/max`限制被满足。
2. **递归处理**:当启用`CLK_SET_RATE_PARENT`时,调整操作向上传递至父时钟。
3. **硬件抽象**:通过回调函数(`determine_rate`/`round_rate`)分离通用逻辑与硬件特定实现。
---
### **总结**
`clk_round_rate`通过结合时钟约束、硬件能力及父时钟状态,动态计算出最匹配目标速率的可行值,为后续实际设置频率(`clk_set_rate`)提供关键输入。其设计充分体现了Linux内核时钟子系统的灵活性与可扩展性。
阅读全文
相关推荐















