用python语言编程，基于鸢尾花数据集，计算并绘制 LR 及 SVM 模型的 P-R 曲线及 ROC 曲线

### 训练LR和SVM模型并绘制P-R曲线与ROC曲线对于鸢尾花数据集，可以采用逻辑回归（Logistic Regression, LR）和支持向量机（Support Vector Machine, SVM）两种方法来构建二分类器，并通过`scikit-learn`库实现模型训练。为了评估这些模型的表现，可以通过计算预测概率并使用`matplotlib`和`sklearn.metrics`模块下的函数来绘制Precision-Recall(P-R)曲线和接收者操作特性(ROC)曲线。 #### 数据预处理由于原始的鸢尾花数据集中有三个类别，在此仅选取两个类别的样本作为正负样本来进行二分类任务。此外，还需要标准化特征值以便更好地适应某些类型的机器学习算法的要求[^2]。 ```python from sklearn import datasets from sklearn.preprocessing import StandardScaler from sklearn.model_selection import train_test_split # 加载鸢尾花数据集 iris = datasets.load_iris() X = iris.data[(iris.target == 0) | (iris.target == 1)] # 只取前两类 y = iris.target[(iris.target == 0) | (iris.target == 1)] # 特征缩放 scaler = StandardScaler().fit(X) X_scaled = scaler.transform(X) # 划分训练集测试集 X_train, X_test, y_train, y_test = train_test_split( X_scaled, y, test_size=0.3, random_state=42, stratify=y) ``` #### 构建LR和SVM模型接下来创建逻辑回归和支持向量机实例，并调用`.fit()`方法完成模型拟合过程；之后再利用`.predict_proba()`获取各条记录属于某一特定类别的可能性分数，这一步骤对于后续绘图至关重要[^4]。 ```python from sklearn.linear_model import LogisticRegression from sklearn.svm import SVC lr_clf = LogisticRegression(random_state=42).fit(X_train, y_train) svm_clf = SVC(probability=True, kernel='linear', C=1e5, random_state=42).fit(X_train, y_train) probas_lr = lr_clf.predict_proba(X_test) probas_svm = svm_clf.predict_proba(X_test) ``` #### 绘制P-R曲线根据得到的概率估计值，借助于`precision_recall_curve`工具函数可方便地获得精确率(precision)-召回率(recall)之间的关系变化情况，并最终形成直观可视化的图形表示形式。 ```python import numpy as np import matplotlib.pyplot as plt from sklearn.metrics import precision_recall_curve, auc def plot_pr_curve(y_true, probas_pred, model_name): precisions, recalls, _ = precision_recall_curve(y_true, probas_pred[:, 1]) pr_auc = auc(recalls, precisions) plt.figure(figsize=(8,6)) plt.plot(recalls, precisions, label=f'{model_name} PR curve (area={pr_auc:.2f})') plt.xlabel('Recall') plt.ylabel('Precision') plt.title(f'Precision-Recall Curve ({model_name})') plt.legend(loc="best") plt.show() plot_pr_curve(y_test, probas_lr, 'Logistic Regression') plot_pr_curve(y_test, probas_svm, 'SVM') ``` #### 绘制ROC曲线同样地，也可以应用类似的思路去展示真正例率(TPR)随假正例率(FPR)增长的趋势，即所谓的ROC曲线。这里会额外引入一个参数——曲线下面积(Area Under the Curve,AUC)，它用来衡量整个分类系统的整体性能优劣程度[^3]。 ```python from sklearn.metrics import roc_curve, RocCurveDisplay fig, ax = plt.subplots(nrows=1, ncols=2, figsize=(12, 6)) for clf, name in zip([lr_clf, svm_clf], ['Logistic Regression', 'SVM']): RocCurveDisplay.from_estimator(clf, X_test, y_test, ax=ax[0], name=name) ax[0].set_title("Receiver Operating Characteristic Curves") plt.tight_layout() plt.show() ``` 上述代码展示了如何基于Python环境中的`scikit-learn`框架快速搭建起针对鸢尾花数据集上执行二元分类任务所需的全部流程，包括但不限于数据准备、模型建立、评价指标可视化等方面的工作内容。

阅读全文

用python语言编程，基于鸢尾花数据集，计算并绘制 LR 及 SVM 模型的 P-R 曲线及 ROC 曲线

相关推荐

基于鸢尾花数据集，计算并绘制 LR 及 SVM 模型的 P-R 曲线及 ROC 曲线

鸢尾花数据集可视化与机器学习模型评估

鸢尾花数据的可视化，并使用Sklearn训练svm和lr模型并绘制出各自的ROC与P-R曲线.zip

【机器学习从零到一】：构建鸢尾花数据集的完整机器学习流程

【R语言大数据处理】：使用R语言处理大规模数据集

防止SVM过拟合：模型选择与交叉验证的最佳实践

理科__理综__化学__化学实验_ANKI牌组_卡片_备考记忆.apkg

用express生成器创建一个有前端页面和后台管理系统的企业站点（后台用node的express框架，数据库用mongodb的mongoose的框架，模板使用的ejs和html）.zip

excel电子表格模板批量自动化-广告效果调查结果与分析.zip

新标准日本语初级（正单词反释义）_ANKI牌组_卡片_备考记忆.apkg

基于facenet深度学习人脸识别，包含训练，测试。web端界面。亚洲人脸数据集。.zip

深度学习新手小广场（机器视觉主题.zip

extjs4.2后台系统（菜单、下拉树组件封装）

蠕动泵控制系统，Arduino下位机程序 与 Qt上位机程序 .zip

excel电子表格模板批量自动化-金鑫商场销售业绩表.zip

基于HTML5_BootStrap_SSM图书查询借阅网站设计可升级SpringBoot毕业源码案例设计.zip

本项目的卷积神经网络使用C语言构建，包括前向传播和反向传播，可对手写数字体进行有效识别.zip

excel电子表格模板批量自动化-企业员工工资核算表.zip

使用faker库生成的json模拟数据

excel电子表格模板批量自动化-公益事业捐款收据.zip

大家在看

ST7789V_320x240TFT屏驱动应用可行.zip

Hi5a控制器操作手册.pdf

Scratch语言教程&案例&相关项目资源

Xilinx 7系列FPGA手册[打包下载]

pipeflow中文版

最新推荐

理科__理综__化学__化学实验_ANKI牌组_卡片_备考记忆.apkg

企业必备数据库备份解决方案SQL软件应用

【C语言线性表全解析】：掌握线性表的10大特性与高效实现技巧

torch和cuda都装了 pycharm里报错ModuleNotFoundError: No module named 'torch'

电脑端JDK与JAR文件调试及手机模拟器使用指南

提升数据查询效率：JDBC在Sqlserver中的10种优化技巧

pytorch国内镜像源pip下载

iCreate5122 U盘量产工具V1.06版发布下载

Java连接Sqlserver数据库：2023性能优化与最佳实践全解析

Packet Tracer,macos

理科理综化学__化学实验_ANKI牌组_卡片_备考记忆.apkg

蠕动泵控制系统，Arduino下位机程序与 Qt上位机程序 .zip

理科理综化学__化学实验_ANKI牌组_卡片_备考记忆.apkg