机器学习的基本步骤流程:
1.数据获取
2.数据基本处理
3.特征工程
4.模型训练
5.模型评估
鸢尾花数据集的机器学习整体流程
1.用sklearn获取数据集(数据集获取)
1.获取数据集
sklearn.datasets
1.小数据集
sklearn.datasets.load_*()
从本地获取
2.大数据集
sklearn.datasets.fetch_*()
从网上下载
subset--表示获取的数据集类型(train/test/all)
默认下载训练数据集(train)
2.数据集返回值
返回类型为bunch--字典类型
返回值属性:
data:特征数据数组
target:目标数组
feature_names: 特征名
target_names: 目标名
DESCR: 数据集介绍
3.数据可视化
import seaborn as sns
&nb