本关任务:使用sklearn完成鸢尾花分类任务。鸢尾花识别
时间: 2024-10-09 21:05:22 浏览: 373
使用scikit-learn库完成鸢尾花(Iris)分类任务是一个经典的机器学习入门示例。鸢尾花数据集包含了三种不同种类的鸢尾花,每种花有四个特征:花萼长度、花萼宽度、花瓣长度和花瓣宽度。这个任务通常用于演示监督学习中的基本概念,如训练模型、评估性能和预测。
以下是使用Python和scikit-learn完成这个任务的一般步骤:
1. **导入库**:
```python
import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
```
2. **加载数据**:
```python
iris = datasets.load_iris()
X = iris.data
y = iris.target
```
3. **预处理**:
- 分割数据集(通常80%训练,20%测试)
- 对数值特征进行标准化(避免某些特征尺度过大影响模型)
```python
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)
```
4. **选择并训练模型**:
- 使用`LogisticRegression`作为线性分类器
```python
model = LogisticRegression()
model.fit(X_train_scaled, y_train)
```
5. **预测与评估**:
```python
y_pred = model.predict(X_test_scaled)
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
```
6. **
阅读全文
相关推荐



















