第一代推理模型,性能与OpenAl-01相当,包括从基于Llama和Qwen的DeepSeek-R1中提取的六个密集模型(需要4.7GB空余空间)
时间: 2025-02-28 14:04:42 浏览: 85
### 性能对比
DeepSeek-R1-Zero 和 OpenAI o1 模型在推理相关基准测试上进行了详细的比较,结果显示 DeepSeek-R1-Zero 在多个方面表现出色[^1]。具体到基于 Llama 和 Qwen 构建的第一代推理模型,这些模型不仅具备与 OpenAI-01 类似的性能水平,而且具有独特的自我进化能力。
### 存储需求
针对 DeepSeek-R1 系列中的六个密集模型,其存储要求如下:
| 模型名称 | 参数量 (Billion) | 存储空间 (GB) |
| -- |
| DS-Llama-Dense-Small | 7 | 4.7 |
| DS-Llama-Dense-Medium | 13 | 8.9 |
| DS-Llama-Dense-Large | 33 | 22.5 |
| DS-Qwen-Dense-Tiny | 4 | 4.7 |
| DS-Qwen-Dense-Medium | 13 | 8.9 |
| DS-Qwen-Dense-XLarge | 65 | 45 |
所有上述提到的六种密集模型均能在最低配置为 **4.7 GB** 自由磁盘空间的情况下运行,这使得它们非常适合资源有限的应用场景。
```python
models = [
{"name": "DS-Llama-Dense-Small", "params": 7, "storage": 4.7},
{"name": "DS-Llama-Dense-Medium", "params": 13, "storage": 8.9},
{"name": "DS-Llama-Dense-Large", "params": 33, "storage": 22.5},
{"name": "DS-Qwen-Dense-Tiny", "params": 4, "storage": 4.7},
{"name": "DS-Qwen-Dense-Medium", "params": 13, "storage": 8.9},
{"name": "DS-Qwen-Dense-XLarge", "params": 65, "storage": 45}
]
for model in models:
print(f"{model['name']} requires {model['storage']} GB storage.")
```
阅读全文
相关推荐









