Sklearn数据集 iris鸢尾花数据集
时间: 2025-03-12 20:10:40 浏览: 50
### 关于 Sklearn 中 Iris 鸢尾花数据集
#### 数据集简介
Iris 数据集是一个经典的多分类数据集,广泛用于模式识别和机器学习领域。该数据集由 Fisher 在 1936 年整理并发布,包含了三种不同种类的鸢尾花卉(Setosa、Versicolour 和 Virginica),每种各有 50 个样本[^3]。
#### 加载数据集的方法
为了方便开发者快速上手实践,在 `sklearn` 库中已经内置了此数据集,可以通过如下方式轻松导入:
```python
from sklearn.datasets import load_iris
iris = load_iris()
```
这段代码会将整个 Iris 数据集加载到名为 `iris` 的变量中,它实际上是一个类似于字典的对象,其中存储着有关这个数据集的各种信息[^2]。
#### 探索数据集结构
一旦成功加载了数据集之后,就可以通过访问其不同的键来查看具体内容:
- **data**: 包含所有样本特征的一个 NumPy 数组;
- **target**: 表示每个样本所属类别的数组;
- **target_names**: 类别名称对应的字符串列表;
- **feature_names**: 各个特征的名字;
- **DESCR**: 描述数据集详情的文字说明;
具体可以执行以下命令来进行初步了解:
```python
print(iris.DESCR) # 输出完整的数据集描述文档
print(iris.data.shape) # 显示 (150, 4),意味着共有 150 条记录以及 4 种测量指标作为输入特性
print(iris.target) # 展现类别标签分布情况
print(iris.target_names) # 打印三个可能的目标值 ['setosa' 'versicolor' 'virginica']
print(iris.feature_names) # 获取四个维度的具体含义 ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
```
上述代码片段可以帮助使用者全面掌握 Iris 数据集中所包含的各项要素及其基本统计概况[^4]。
#### 特征解释
对于每一朵花来说,都测定了四方面的数值:
- 萼片长度(sepal length)
- 萼片宽度(sepal width)
- 宠物长度(petal length)
- 宠物宽度(petal width)
这些度量单位均为厘米(cm)。
阅读全文
相关推荐


















