import numpy as np import pandas as pd from sklearn.model_selection import train_test_split from sklearn.metrics import classification_report import matplotlib.pyplot as plt from sklearn.preprocessing import StandardScaler # 定义sigmoid函数 def sigmoid(z): return 1 / (1 + np.exp(-z)) # 定义逻辑回归的梯度下降函数 def gradient_descent(X, y, theta, learning_rate, num_iterations): m = len(y)#元素个数 cost_history = [] for i in range(num_iterations): h = sigmoid(X.dot(theta)) gradient = X.T.dot(h - y) / m theta = theta - learning_rate * gradient cost = -np.sum(y * np.log(h) + (1 - y) * np.log(1 - h)) / m cost_history.append(cost) return theta, cost_history # 读取数据 data = pd.read_csv('credit-overdue.csv') X = data[['debt', 'income']].values y = data['overdue'].values # # 标准化 # scaler = StandardScaler() # X = scaler.fit_transform(X) # 数据预处理，添加偏置项 X = np.hstack((np.ones((X.shape[0], 1)), X))#np.ones方法生成了一列1，hstack将这一列1和原来的矩阵和起来，现在的x多一个1，参数多一个b # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 初始化参数 theta = np.zeros(X_train.shape[1])#初始化参数 learning_rate = 0.01#学习率 num_iterations = 1000#迭代次数 # 执行梯度下降 theta, cost_history = gradient_descent(X_train, y_train, theta, learning_rate, num_iterations) # 预测 y_pred = sigmoid(X_test.dot(theta)) y_pred = (y_pred >= 0.5).astype(int)#将布尔值转化为整数 # 输出分类报告 print(classification_report(y_test, y_pred)) # 绘制损失函数的迭代过程 plt.plot(range(num_iterations), cost_history) plt.xlabel('Iterations') plt.ylabel('Cost') plt.title('Gradient Descent Progress') plt.show() # 绘制分类线 x1_min, x1_max = X[:, 1].min(), X[:, 1].max()#最原始数据x的第一列 x2_min, x2_max = X[:, 2].min(), X[:, 2].max() # 生成网格坐标点（用于绘制决策边界） xx1, xx2 = np.meshgrid( np.linspace(x1_min, x1_max, 100), # 在x1范围内生成100个等间距点，xx1每列数据完全重复，第i列所有元素值 = 第i个x1坐标值（因为按行分配点） np.linspace(x2_min, x2_max, 100) # 在x2范围内生成100个等间距点，xx2每行数据完全重复，第i行所有元素值 = 第i个x2坐标值（因为按列分配点） ) # xx1和xx2均为100x100的矩阵， # 计算网格点上逻辑回归的预测概率（为了画阈值为0.5的等高线，可视化参数） Z = sigmoid(np.c_[np.ones(xx1.ravel().shape[0]), xx1.ravel(), xx2.ravel()].dot(theta))#ravel，按行将二维展成一维列向量的转置 #相当于ones生成1w长度的列全1，np.c_用于连接数组，将多个列，组成一个二维矩阵，dot矩阵乘法，10000*3的矩阵*3*1的矩阵10000的一个列向量 #调用上面的逻辑回归函数，生成预测值的结果向量 Z = Z.reshape(xx1.shape) # 将预测结果Z恢复为100x100的网格形状 plt.figure(figsize=(10, 6)) # 创建画布 # 绘制未逾期样本（标签为0）的散点图 plt.scatter(X[y == 0, 1], X[y == 0, 2], # 选择标签为0的样本的x1和x2，最开始的数据 c='b', # 蓝色标记 marker='o', # 圆形标记 label='Not Overdue') # 图例标签 # 绘制逾期样本（标签为1）的散点图 plt.scatter(X[y == 1, 1], X[y == 1, 2], # 选择标签为1的样本的x1和x2 c='r', # 红色标记 marker='x', # 叉形标记 label='Overdue') # 图例标签 # 添加决策边界线（σ(z)=0.5对应的等高线） plt.contour(xx1, xx2, Z, # 根据预测概率，绘制一条阈值为0.5的等高线，将训练后得到的theta可视化处理 levels=[0.5], # 指定绘制σ(z)=0.5的等高线 colors='black', # 黑色边界线 linestyles='dashed') # 虚线样式 # 设置坐标轴标签和标题 plt.xlabel('Debt') # x轴：债务（假设X[:,1]代表债务） plt.ylabel('Income') # y轴：收入（假设X[:,2]代表收入） plt.title('Logistic Regression Decision Boundary') # 标题 plt.legend() # 显示图例 plt.grid(True, linestyle='--', alpha=0.5) # 添加半透明虚线网格 plt.show() # 显示图形为这段代码编写一个标准化代码

import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.model_selection import train_test_split from sklearn.preprocessing import MinMaxScaler from sklearn.linear_model import LogisticRegression from sklearn.tree import DecisionTreeClassifier from sklearn.neighbors import KNeighborsClassifier from sklearn.svm import SVC from sklearn.metrics import classification_report from sklearn.metrics import confusion_matrix

这段代码是在 Python 中导入了一些常用的机器学习库和模块，包括 pandas、numpy、matplotlib、sklearn 等。其中： - pandas 是 Python 中常用的数据分析库，可以用来读取和处理数据； - numpy 是 Python 中常用的...

写完这些代码后： import pandas as pd import numpy as np from sklearn.preprocessing import StandardScaler from sklearn.model_selection import train_test_split from sklearn.metrics import confusion_matrix,classification_report from sklearn.metrics import roc_curve import matplotlib.pyplot as plt from sklearn.linear_model import logisticRegression 出现了下面的错误 partially initialized module 'sklearn' has no attribute 'version' (most likely due to a circular import)请问这个错误怎么修改

这个错误通常是由于环境问题导致的。尝试升级 scikit-learn 库到最新版本，可以使用以下命令来升级： ...另外，确保在代码文件中没有命名为 "sklearn.py" 的文件，这可能会导致命名冲突并导致该错误。

这个代码有什么错误吗：import pandas as pd import numpy as np import matplotlib as matplt import matplotlib.pyplot as plt import wordcloud as wc from wordcloud import WordCloud import sklearn as sk from sklearn.datasets import load_wine from sklearn.datasets import make_blobs from sklearn.datasets import load_breast_cancer from sklearn.datasets import load_iris from sklearn.datasets import load_digits from sklearn.datasets import load_boston from sklearn.datasets import load_diabetes from sklearn.neighbors import KNeighborsClassifier from sklearn.preprocessing import StandardScaler from sklearn.model_selection import train_test_split from sklearn.metrics import classification_report import tensorflow as tf import PIL from PIL import Image,ImageFilter fashion_mnist = tf.keras.datasets.fashion_mnist (X_train, y_train), (X_test, y_test) = fashion_mnist.load_data() mnist = tf.keras.datasets.mnist (X_train, y_train), (X_test, y_test) = mnist.load_data() cifar10 = tf.keras.datasets.cifar10 (X_train, y_train), (X_test, y_test) = cifar10.load_data() print("numpy:", np.version) print("pandas:", pd.version) print("matplotlib:", matplt.version) print("jieba:", jieba.version) print("wordcloud:", wc.version) print("sklearn:", sk.version) print("tensorflow:", tf.version) print("pillow:", PIL.version)

print(jieba.__version__) # 未导入直接使用会报NameError 需补充导入语句： python import jieba - **缺少依赖声明**：若项目依赖jieba但未在requirements.txt中声明，会导致环境部署失败。...

# 数据集特征分析相关库import pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns# 数据集预处理相关库from sklearn.preprocessing import StandardScalerfrom sklearn.model_selection import train_test_split# K近邻算法相关库from sklearn.neighbors import KNeighborsClassifierfrom sklearn.model_selection import cross_val_scorefrom sklearn.metrics import precision_score,recall_score,f1_scorefrom sklearn.metrics import precision_recall_curve,roc_curve,average_precision_score,auc# 决策树相关库from sklearn.tree import DecisionTreeClassifier# 随机森林相关库from sklearn.ensemble import RandomForestClassifier# 逻辑回归相关库from sklearn.linear_model import LogisticRegression# SGD分类相关库from sklearn.linear_model import SGDClassifier

from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler X = data.drop(columns=['target']) y = data['target'] # 划分训练集和测试集 X_train, X_test, y_...

import csv import numpy as np from sklearn.preprocessing import StandardScaler from sklearn.model_selection import train_test_split import matplotlib.pyplot as plt from datetime import datetime from sklearn.metrics import explained_variance_score from sklearn.metrics import mean_squared_error from sklearn.metrics import accuracy_score from sklearn.metrics import confusion_matrix from sklearn.metrics import classification_report from sklearn import metrics from sklearn.metrics import mean_absolute_error # 平方绝对误差 import random import pandas as pd import xgboost as xgb #一段 915~1158.3 data = pd.read_csv('Train_data.csv', header=None) GR = data.values[:41, 3:4] LLD = data.values[:41, 4:5] LLS = data.values[:41, 5:6] AC = data.values[:41, 6:7] #训练特征数据 X=np.concatenate((GR,AC,LLS,LLD),axis=1) X[np.isnan(X)] = 0 #训练目标数据 TC = data.values[:41, 1:2] X_train, X_test, y_train, y_test = train_test_split(X, TC, test_size=0.4,random_state=1)

这段代码是用于数据预处理和训练集测试集的划分的。首先，通过pandas库中的read_csv函数读取名为'Train_data.csv'的文件，并...最后，使用train_test_split函数将X和TC划分为训练集和测试集，其中测试集占总数据的40%。

import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns plt.style.use('seaborn-v0_8') sns.set_palette("husl") # 使用统一色板 plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签 plt.rcParams['axes.titlepad'] = 20 # 标题间距 plt.rcParams['font.sans-serif'] = ['SimHei'] from sklearn.model_selection import train_test_split, GridSearchCV from sklearn.preprocessing import StandardScaler from sklearn.feature_selection import SelectKBest, f_classif from sklearn.linear_model import LogisticRegression from sklearn.metrics import accuracy_score, classification_report, roc_curve, auc, confusion_matrix import statsmodels.api as sm from sklearn.metrics import precision_score, roc_curve plt.style.use('ggplot')可视图不显示中文

from sklearn.model_selection import train_test_split, GridSearchCV from sklearn.preprocessing import StandardScaler from sklearn.feature_selection import SelectKBest, f_classif from sklearn.linear_...

import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.svm import SVC from sklearn.ensemble import BaggingClassifier from sklearn.model_selection import RepeatedStratifiedKFold from sklearn.metrics import (accuracy_score, roc_auc_score, recall_score, confusion_matrix, roc_curve, precision_score) from sklearn.utils import resample from sklearn.feature_selection import SelectFromModel # 读取数据 train_data = pd.read_excel('pcr-特征/pre_processed_results/train_rf_top15.xlsx') test_data = pd.read_excel('pcr-特征/pre_processed_results/test_rf_top15.xlsx') # 特征与目标变量 X_train = train_data.drop(columns=['id', 'pcr','local']) y_train = train_data['pcr'] X_test = test_data.drop(columns=['id', 'pcr','local']) y_test = test_data['pcr']后续通过决策树建立模型

from sklearn.model_selection import train_test_split from sklearn.preprocessing import LabelEncoder, OneHotEncoder from sklearn.impute import SimpleImputer # 1. 读取Excel数据 data = pd.read_excel('...

import sklearn.model_selection as ms datas=pd.read_csv(r'C:/Users/20397/Desktop/人工智能实训材料/Day3 分类/wisc_bc_data.csv',sep=',') x=datas.iloc[:,2:32] y=datas.iloc[:,1:2] x_train,x_test,y_train,y_test=ms.train_test_split(x,y,test_size=0.2,random_state=42) y_train=y_train.values.ravel() y_test=y_test.values.ravel() #构建和训练模型 import numpy as np import matplotlib.pyplot as plt from sklearn.neighbors import KNeighborsClassifier import pandas as pd # 构建 knn 模型 knn= KNeighborsClassifier(n_neighbors=43,weights='distance',p=2) #训练KNN模型 knn.fit(x_train,y_train) knn.score(x_train,y_train) # 评估模型效果 from sklearn.metrics import classification_report y_pred=knn.predict(x_test) print(classification_report(y_test,y_pred))

然后使用 sklearn 中的 train_test_split 函数将数据切分为训练集和测试集，其中测试集占比为 20%。接着，使用 KNeighborsClassifier 构建 KNN 模型，其中 n_neighbors 为 43，weights 为 'distance'，p 为 2。然后...

#根据编程要求，补充下面Begin-End区间的代码 import numpy as np import pandas as pd import numpy as np import pandas as pd from sklearn.tree import DecisionTreeClassifier, export_graphviz # 导入决策树模型 from sklearn.model_selection import train_test_split # 导入数据集划分模块 import matplotlib.pyplot as plt from sklearn.metrics import roc_auc_score from sklearn.metrics import classification_report # 数据的读入与处理 data_path ='/data/bigfiles/7db918ff-d514-49ea-8f6b-ea968df742e9' df = pd.read_csv(data_path,header=None,names=['age', 'workclass', 'fnlwgt', 'education', 'education-num','marital-status','occupation','relationship','race','sex','capital-gain','capital-loss','hours-per-week','native-country','salary']) ######Begin ###### # 去除字符串数值前面的空格 # 去除fnlwgt, capital-gain, capital-loss,特征属性 # 将特征采用哑变量进行编码，字符型特征经过转化可以进行训练 # 将label编码 ###### End ###### ######Begin ###### # 按4：1的比例划分训练和测试集 # 构建模型 #对训练集X_train训练 #对于测试集x_test进行预测 # 其他指标计算 print(classification_report(y_test, x_pre_test)) # 预测测试集概率值 #计算验证集的auc值,参数为预测值和概率估计 ###### End ###### print("auc的值：{}".format(auc))

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 构建模型 dt = DecisionTreeClassifier(random_state=42) # 对训练集X_train训练 dt.fit(X_train, y_train) # ...

import numpy as np import matplotlib.pyplot as plt import pandas as pd path="https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data" headernames=['sepal-length','sepal-width','petal-length','petal-width','Class'] dataset=pd.read_csv(path,names=headernames) dataset.head() X=dataset.iloc[:,:-1].values y=dataset.iloc[:,4].values from sklearn.model_selection import train_test_split X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.40) from sklearn.neighbors import KNeighborsClassifier classifier=KNeighborsClassifier(n_neighbors=6) classifier.fit(X_train,y_train) y_pred=classifier.predict(X_test) from sklearn.metrics import classification_report,confusion_matrix,accuracy_score result = confusion_matrix(y_test,y_pred) print("Confusion Matrix:") print(result) result1=classification_report(y_test,y_pred) print(result1) result2=accuracy_score(y_test,y_pred) print("Accuracy:",result2)

代码首先导入了必要的库，然后读取鸢尾花数据集并将其存储在一个Pandas DataFrame中。接下来，将数据集分成训练集和测试集，并使用KNN分类器对训练集进行训练。最后，使用测试集对训练好的分类器进行测试，并计算...

执行了以下代码： import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from sklearn.model_selection import train_test_split from sklearn.naive_bayes import GaussianNB from sklearn.metrics import accuracy_score, classification_report, confusion_matrix from pgmpy.estimators import TreeSearch from pgmpy.models import BayesianNetwork from pgmpy.estimators import BayesianEstimator # ====================================== # 1. 数据加载与预处理 # ====================================== file_paths = ['H.csv', 'L.csv', 'LL.csv'] labels = ["H", "L", "LL"] dfs = [] for file, label in zip(file_paths, labels): df = pd.read_csv(file, header=None, names=['Fs', 'Fa']) df['Label'] = label dfs.append(df) data = pd.concat(dfs, ignore_index=True) X = data[['Fs', 'Fa']] y = data['Label'] X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) # ====================================== # 2. 训练朴素贝叶斯分类器 # ==================================

from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler # 加载数据 data = load_iris() X, y = data.data, data.target # 标准化（高斯朴素贝叶斯建议使用） ...

这是我的代码怎样在交叉验证中直接使用Pipeline，避免数据泄露代码：import numpy as np import pandas as pd from sklearn.model_selection import train_test_split import matplotlib.pyplot as plt from sklearn.preprocessing import StandardScaler import seaborn as sns from scipy import stats # 读取数据 surface = pd.read_csv(r'C:\Users\。\Desktop\RF_2.csv', sep=";", encoding='utf-8-sig') #转化地层类型的为整型数值 surface.loc[surface['地层类型'] != '粉质粘土和砂质粉土', '地层类型'] = 0 surface.loc[surface['地层类型'] == '粉质粘土和砂质粉土', '地层类型'] = 1 surface['地层类型'] = surface['地层类型'].astype('int') # 清理列名中的空格 surface.columns = surface.columns.str.strip() print("清洗后的列名:", surface.columns.tolist()) # 分离特征和目标（使用清洗后的列名） features = surface.iloc[:, :-1] # 前8列作为特征 target = surface.iloc[:, -1] # 最后一列"地表沉降"作为目标 print("\n原始特征矩阵形状:", features.shape) # 2. 数据标准化（关键修正：转换为DataFrame） # ============================================= scaler = StandardScaler() scaled_features = pd.DataFrame( scaler.fit_transform(features), columns=features.columns # 保留列名 ) print("\n标准化后的特征矩阵示例:") print(scaled_features.head()) # 3. 特征选择（修正相关性计算） # ============================================= # 合并标准化后的特征和目标 surf_he = pd.concat([scaled_features, target], axis=1) # 计算相关性矩阵 corr_matrix = surf_he.corr() # 提取目标相关性并筛选 corr_with_target = corr_matrix['地表沉降'].drop('地表沉降') selected_features = corr_with_target[abs(corr_with_target) > 0.3].index.tolist() print("\n高相关性特征(|r|>0.3):", selected_features) import numpy as np import pandas as pd from sklearn.model_selection import train_test_split, KFold, cross_val_score from sklearn.ensemble import RandomForestRegressor from sklearn.metrics import mean_squared_error, r2_score import matplotlib.pyplot as plt import seaborn as sns # 混沌自适应麻雀搜索算法（CASSA）实现 # ============================================= def logistic_chaos(n, mu=4.0, x0=0.3): """生成Logistic混沌序列""" chaos = [x0] for _ in range(n-1): x = chaos[-1] chaos.append(mu * x * (1 - x)) return np.array(chaos) def cassa_optimization(fitness_func, boun

from sklearn.model_selection import train_test_split # 生成数据 X, y = make_classification(n_samples=1000) X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2) # 定义Pipeline ...

1. Use the credictcard-reduced.csv dataset ([Data description](https://www.kaggle.com/mlg-ulb/creditcardfraud)) and build Five classification models. Please plot confusion matrix, and evaluate your model performance using accuracy, precision, recall, F-score (70 points). A list of classification models can be found [here](https://scikit-learn.org/stable/auto_examples/classification/plot_classifier_comparison.html) 我现在要完成以上作业，已输入下面代码from sklearn.model_selection import train_test_split # this function provides a single "Hold-Out" Validation. import matplotlib.pyplot as plt from sklearn.metrics import accuracy_score #similar to MAE, we use accuracy_score evaluation metric. import pandas as pd import numpy as np data = pd.read_csv('Credit_approval.csv',header='infer') data.head(5)Y = data['Approved'] #this is our prediction target X = data.drop(['Approved'],axis=1) X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.4, random_state=1) rom sklearn.tree import DecisionTreeClassifier clf = DecisionTreeClassifier(max_depth=2) # number estimators is the key parameter clf = clf.fit(X_train, Y_train) Y_predTrain = clf.predict(X_train) Y_predTest = clf.predict(X_test) print('Training accuracy is %f' % accuracy_score(Y_train, Y_predTrain)) print('Validation accuracy is %f' %accuracy_score(Y_test, Y_predTest))from sklearn.ensemble import RandomForestClassifier np.random.seed(1) #because the model has random sampling, a random seed can ensure repeated results. clf = RandomForestClassifier(max_depth=2,n_estimators=500) clf = clf.fit(X_train, Y_train) Y_predTrain = clf.predict(X_train) Y_predTest = clf.predict(X_test) print('Training accuracy is %f' % accuracy_score(Y_train, Y_predTrain)) print('Validation accuracy is %f' %accuracy_score(Y_test, Y_predTest)) 接下来怎么办

from sklearn.metrics import classification_report, ConfusionMatrixDisplay def evaluate_model(model, X_train, X_test, Y_train, Y_test, model_name): # 预测 Y_pred_train = model.predict(X_train) Y_...

from sklearn.feature_selection import RFECV from sklearn.model_selection import StratifiedKFold from sklearn.tree import DecisionTreeClassifier, plot_tree from sklearn.metrics import classification_report, roc_auc_score, confusion_matrix, precision_recall_curve from imblearn.over_sampling import SMOTE import matplotlib.pyplot as plt import seaborn as sns import numpy as np from sklearn.utils.class_weight import compute_class_weight # ==================== # 数据集SMOTE重采样 # ==================== # 使用SMOTE进行训练集的重采样 smote = SMOTE(random_state=42) X_train_resampled, y_train_resampled = smote.fit_resample(X_train, y_train) # ==================== # 递归特征消除 (RFECV) # ==================== # 初始化基模型 base_model = DecisionTreeClassifier( max_depth=3, min_samples_split=10, min_samples_leaf=5, class_weight='balanced', random_state=42 ) # 配置RFECV selector = RFECV( estimator=base_model, step=1, # 每次迭代移除1个特征 min_features_to_select=3, # 至少保留3个特征 cv=StratifiedKFold(5), # 分层交叉验证 scoring='roc_auc', n_jobs=-1 ) # 执行特征选择 selector.fit(X_train_resampled, y_train_resampled) # 获取选择的特征 selected_features = X_train.columns[selector.support_].tolist() print(f"\nRFECV选择特征数: {len(selected_features)}/{X_train.shape[1]}") print("选中的特征:", selected_features) # 筛选数据集 X_train_rfe = X_train_resampled[selected_features] X_test_rfe = X_test[selected_features] # ==================== # 使用最优特征重新训练 # ==================== optimized_model = DecisionTreeClassifier( max_depth=4, min_samples_split=10, min_samples_leaf=5, class_weight='balanced', random_state=42 ) optimized_model.fit(X_train_rfe, y_train_resampled) # ==================== # 完整评估函数（增强版） # ==================== def enhanced_evaluation(model, X_train, y_train, X_test, y_test): def get_metrics(y_true, y_pred, y_proba): tn, fp, fn, tp = confusion_matrix(y_true, y_pred).ravel() specificity = tn / (tn + fp) recall = tp / (tp + fn) ppv = tp / (tp + fp)

from sklearn.model_selection import train_test_split from imblearn.over_sampling import SMOTE from sklearn.feature_selection import RFECV from sklearn.tree import DecisionTreeClassifier from sklearn....

import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.metrics import classification_report, confusion_matrix, ConfusionMatrixDisplay from sklearn.pipeline import make_pipeline # 选择5个分类器 selected_classifiers = { "Random Forest": RandomForestClassifier(n_estimators=100, random_state=42), "Logistic Regression": LogisticRegression(max_iter=1000, random_state=42), "XGBoost": XGBClassifier(use_label_encoder=False, eval_metric='logloss'), "SVM": SVC(kernel='rbf', probability=True, random_state=42), "Neural Network": MLPClassifier(hidden_layer_sizes=(50,), max_iter=1000, random_state=42) } # 数据准备 df = pd.read_csv('credictcard-reduced.csv') X = df.drop(['Time', 'Class'], axis=1) # 移除时间和标签列 y = df['Class'] # 划分数据集 X_train, X_test, y_train, y_test = train_test_split( X, y, test_size=0.3, stratify=y, random_state=42 ) # 标准化处理 scaler = StandardScaler() X_train = scaler.fit_transform(X_train) X_test = scaler.transform(X_test) # 创建可视化画布 fig, axes = plt.subplots(2, 5, figsize=(25, 10)) plt.subplots_adjust(wspace=0.4, hspace=0.4) # 训练和评估模型 for idx, (name, clf) in enumerate(selected_classifiers.items()): # 训练模型 clf.fit(X_train, y_train) y_pred = clf.predict(X_test) # 计算评估指标 report = classification_report(y_test, y_pred, output_dict=True) metrics_df = pd.DataFrame(report).transpose() # 绘制混淆矩阵 cm = confusion_matrix(y_test, y_pred) disp = ConfusionMatrixDisplay(confusion_matrix=cm) disp.plot(ax=axes[0, idx], cmap='Blues') axes[0, idx].set_title(f'{name}\nConfusion Matrix') # 显示指标表格 cell_text = [[f"{metrics_df.loc['1']['precision']:.2f}", f"{metrics_df.loc['1']['recall']:.2f}", f"{metrics_df.loc['1']['f1-score']:.2f}"]] table = axes[1, idx].table(cellText=cell_text, colLabels=['Precision', 'Recall', 'F1'], loc='center', cellLoc='center') table.set_fontsize(14) table.scale(1, 2) axes[1, idx].axis('off') axes[1, idx].set_title('Class 1 Metrics') plt.show() # 输出详细评估报告 print("\n\033[1m综合性能报告：\033[0m") for name, clf in selected_classifiers.items(): y_pred = clf.predict(X_test) print(f"\n\033[1m{name}\033[0m") print(classification_report(y_test, y_pred, target_names=['0', '1'])) 将这一段的代码里面的XGBoost 改成decision tree ,jiang svm改成 adaboots,并且增加之前没有的from sklearn ... 的没有预先导入的内容

用户当前的导入包括pandas、numpy、matplotlib.pyplot，以及sklearn中的train_test_split、StandardScaler、分类报告、混淆矩阵、管道等。但没有导入DecisionTreeClassifier和AdaBoostClassifier，所以需要添加这两...

网络经济年度报告.docx

软件和信息服务业投融资典型案例分析.docx

相关推荐

kNN.zip_KNN 分类 python_knn_knn python实现_knn分类python_数字数据集

SVM.zip_SVM Iris分类_UCI SVM_iris_svm预测_uci svm

AI实战-HR数据工程师职位变动数据集分析预测实例（含18个源代码+2.09 MB完整的数据集）.zip

网络经济年度报告.docx

软件和信息服务业投融资典型案例分析.docx

大家在看

利用ioctl进行设备管理-驱动程序设计

SmartSVN license

linphone 4.1.1 SDK，C# Demo封装包，包含封装CS文件和所需要Dll，直接拉入项目即可

天津大学计算机网络上机实验

pair_gran_hertz_history_history_Hertz_hertz接触模型Lammps_lammps_接触模

最新推荐

网络经济年度报告.docx

软件和信息服务业投融资典型案例分析.docx

基于云计算大数据的图书馆创新发展模式研究.docx

中国医疗大数据行业市场现状及发展趋势分析-技术应用环境将更加成熟.docx

微服务高可用网关与容错架构实践.docx

掌握Java端口扫描器：从入门到实践

【性能测试基准】：为RK3588选择合适的NVMe性能测试工具指南

vllm部署大模型为什么只用一张卡怎么设置成多卡

ASP+access实现的新闻管理系统开发教程

【固态硬盘寿命延长】：RK3588平台NVMe维护技巧大公开