# Ultralytics YOLO 🚀, AGPL-3.0 license # YOLO11 object detection model with P3-P5 outputs. For Usage examples see https://docs.ultralytics.com/tasks/detect # Parameters nc: 80 # number of classes scales: # model compound scaling constants, i.e. 'model=yolo11n.yaml' will call yolo11.yaml with scale 'n' # [depth, width, max_channels] n: [0.50, 0.25, 1024] # summary: 319 layers, 2624080 parameters, 2624064 gradients, 6.6 GFLOPs s: [0.50, 0.50, 1024] # summary: 319 layers, 9458752 parameters, 9458736 gradients, 21.7 GFLOPs m: [0.50, 1.00, 512] # summary: 409 layers, 20114688 parameters, 20114672 gradients, 68.5 GFLOPs l: [1.00, 1.00, 512] # summary: 631 layers, 25372160 parameters, 25372144 gradients, 87.6 GFLOPs x: [1.00, 1.50, 512] # summary: 631 layers, 56966176 parameters, 56966160 gradients, 196.0 GFLOPs # YOLO11n backbone backbone: # [from, repeats, module, args] - [-1, 1, Conv, [64, 3, 2]] # 0-P1/2 - [-1, 1, Conv, [128, 3, 2]] # 1-P2/4 - [-1, 2, C3k2, [256, False, 0.25]] - [-1, 1, Conv, [256, 3, 2]] # 3-P3/8 - [-1, 2, C3k2, [512, False, 0.25]] - [-1, 1, Conv, [512, 3, 2]] # 5-P4/16 - [-1, 2, C3k2, [512, True]] - [-1, 1, Conv, [1024, 3, 2]] # 7-P5/32 - [-1, 2, C3k2, [1024, True]] - [-1, 1, SPPF, [1024, 5]] # 9 - [-1, 2, C2PSA, [1024]] # 10 # YOLO11n head head: - [-1, 1, nn.Upsample, [None, 2, "nearest"]] - [[-1, 6], 1, Concat, [1]] # cat backbone P4 - [-1, 2, C3k2, [512, False]] # 13 - [-1, 1, nn.Upsample, [None, 2, "nearest"]] - [[-1, 4], 1, Concat, [1]] # cat backbone P3 - [-1, 2, C3k2, [256, False]] # 16 (P3/8-small) - [-1, 1, nn.Upsample, [None, 2, "nearest"]] - [[-1,2], 1, Concat, [1]] # cat head P2 - [-1, 2, C3k2, [128, False]] # 19 (P2/4-xsmall) - [-1, 1, Conv, [128, 3, 2]] - [[-1, 16], 1, Concat, [1]] # cat head P3 - [-1, 2, C3k2, [256, False]] # 22 (P4/16-medium) - [-1, 1, Conv, [256, 3, 2]] - [[-1, 13], 1, Concat, [1]] # cat head P4 - [-1, 2, C3k2, [512, False]] # 25 (P4/16-medium)
时间: 2025-03-30 21:11:08 浏览: 66
### Ultralytics YOLOv11 模型架构与参数详解
#### 模型概述
Ultralytics 的 YOLO 系列模型以其高效性和准确性著称。YOLOv11 是该系列中的最新版本之一,继承并改进了许多前代模型的设计理念[^1]。其核心设计围绕着高效的 backbone 和 head 结构展开。
---
#### Backbone 部分的模块定义及其作用
Backbone 主要负责提取输入图像的特征图。在 YOLOv11 中,backbone 基于 CSPNet(Cross Stage Partial Network),这是一种能够显著减少计算量的同时保持高精度的网络结构。
- **CSPDarknet**: 这是一个轻量化的基础骨干网,通过引入跨阶段部分连接机制来降低内存消耗和提升推理速度。它由多个卷积层组成,并利用残差块增强特征表达能力。
```python
# 示例代码片段展示 CSPDarknet 的一部分实现逻辑
class C3(nn.Module):
def __init__(self, c1, c2, n=1, shortcut=True, g=1, e=0.5):
super().__init__()
c_ = int(c2 * e) # hidden channels
self.cv1 = Conv(c1, c_, 1, 1)
self.cv2 = Conv(c1, c_, 1, 1)
self.cv3 = Conv(2 * c_, c2, 1) # act=FReLU(c2)
self.m = nn.Sequential(*(Bottleneck(c_, c_, shortcut, g, e=1.0) for _ in range(n)))
def forward(self, x):
return self.cv3(torch.cat((self.m(self.cv1(x)), self.cv2(x)), dim=1))
```
- **SPP (Spatial Pyramid Pooling)**: SPP 层用于捕获多尺度的空间信息,在检测大目标时尤为重要。它通过对不同大小的感受野进行池化操作,增强了模型对多种尺寸物体的适应性。
---
#### Head 部分的模块定义及其作用
Head 负责基于 backbone 提取到的特征图预测最终的目标框位置、类别概率以及置信度得分。
- **FPN (Feature Pyramid Network)**: FPN 将高层语义信息传递给低层特征图,从而提高小目标的检测性能。这种自顶向下的路径允许更细粒度的信息融合。
- **PANet (Path Aggregation Network)**: PANet 在传统 FPN 的基础上进一步优化了特征金字塔结构,增加了额外的自底向上路径以加强全局上下文感知能力。这使得模型能够在复杂场景下更好地定位目标对象。
- **Anchor-Free 或 Anchor-Based Detection**: 根据具体需求,YOLOv11 支持两种不同的边界框回归方式——anchor-free 方法直接从像素点预测偏移量;而 anchor-based 则依赖预设锚点作为初始估计值。两者各有优劣,需根据实际应用场景选择合适策略。
---
#### 参数配置详解
以下是 `yolov11.yaml` 文件中常见的几个重要超参数解释:
- `[depth, width, max_channels]`: 如前所述,这些变量控制整个神经网络规模调整比例关系。其中 depth 影响层数增减程度,width 决定每层内部单元数量变化幅度,max_channels 设置单个张量维度上限阈值防止过拟合现象发生。
- `anchors`: 如果采用的是 anchor-based 方案,则需要预先设定一组合理的先验框形状集合供后续训练过程参考使用。通常情况下会依据数据集统计特性自动聚类生成最佳候选列表。
- `hyp`: 包含一系列学习率调度器曲线形式、权重衰减值以及其他正则项系数等内容在内的超级参数字典表。合理调节它们有助于加快收敛速率同时抑制泛化误差增长趋势。
---
#### 总结
综上所述,Ultralytics YOLOv11 不仅延续了家族一贯以来追求极致效率的传统优势,而且还在诸多细节之处做出了创新尝试。无论是基础框架搭建还是高级功能扩展方面都展现出了极高的技术水平与工程实践价值。
```python
# 下面给出一段简单的伪代码用来演示如何加载 yolov11.yaml 并初始化对应实例对象
from ultralytics import YOLO
model = YOLO('yolov11.yaml') # 加载 YAML 配置文件创建新项目模板
results = model.train(data='coco128.yaml', epochs=100, imgsz=640) # 开始正式训练流程
```
---
阅读全文
相关推荐













