from sklearn import preprocessing min_max_scaler = preprocessing.MinMaxScaler() df0=min_max_scaler.fit_transform(df1) df = pd.DataFrame(df0, columns=df1.columns) x=df.iloc[:,:-1] y=df.iloc[:,-1] #划分训练集测试集 cut=300#取最后cut=30天为测试集 x_train, x_test=x.iloc[:-cut],x.iloc[-cut:]#列表的切片操作，X.iloc[0:2400，0:7]即为1-2400行，1-7列 y_train, y_test=y.iloc[:-cut],y.iloc[-cut:] x_train, x_test=x_train.values, x_test.values y_train, y_test=y_train.values, y_test.values

时间: 2023-05-19 18:05:36 浏览: 123

这段代码使用了sklearn库中的preprocessing模块，导入了MinMaxScaler类。然后，对df1数据进行了归一化处理，将处理后的结果存储在df0中。接着，将df0转换成了DataFrame格式，并将列名设置为df1的列名。最后，将df中的特征数据和标签数据分别存储在x和y中。

优化下列代码from sklearn import preprocessing min_max_scaler = preprocessing.MinMaxScaler() df0=min_max_scaler.fit_transform(df1) df = pd.DataFrame(df0, columns=df1.columns) X=df.iloc[:,:-1] y=df['target']#切片是前闭后开[) print(X.shape) print(y.shape)

代码已经非常简洁和优化了，但是可以将第1行和第3行合并，如下所示： ```python from sklearn.preprocessing import MinMaxScaler min_max_scaler = MinMaxScaler() df = pd.DataFrame(min_max_scaler.fit_transform(df1), columns=df1.columns) X = df.iloc[:, :-1] y = df['target'] print(X.shape) print(y.shape) ``` 合并后的代码更加简洁，但是不影响程序的功能。另外，可以考虑将print语句移到代码最后，以避免在运行过程中有太多的输出。

import numpy as np import pandas as pd import matplotlib.pyplot as plt import BPNN from sklearn import metrics from sklearn.metrics import mean_absolute_error from sklearn.metrics import mean_squared_error #导入必要的库 df1=pd.read_excel(r'D:\Users\Desktop\大数据\44.xls',0) df1=df1.iloc[:,:] #进行数据归一化 from sklearn import preprocessing min_max_scaler = preprocessing.MinMaxScaler() df0=min_max_scaler.fit_transform(df1) df = pd.DataFrame(df0, columns=df1.columns) x=df.iloc[:,:4] y=df.iloc[:,-1] #划分训练集测试集 cut=4#取最后cut=30天为测试集 x_train, x_test=x.iloc[4:],x.iloc[:4]#列表的切片操作，X.iloc[0:2400，0:7]即为1-2400行，1-7列 y_train, y_test=y.iloc[4:],y.iloc[:4] x_train, x_test=x_train.values, x_test.values y_train, y_test=y_train.values, y_test.values #神经网络搭建 bp1 = BPNN.BPNNRegression([4, 16, 1]) train_data=[[sx.reshape(4,1),sy.reshape(1,1)] for sx,sy in zip(x_train,y_train)] test_data = [np.reshape(sx,(4,1))for sx in x_test] #神经网络训练 bp1.MSGD(train_data, 1000, len(train_data), 0.2) #神经网络预测 y_predict=bp1.predict(test_data) y_pre = np.array(y_predict) # 列表转数组 y_pre=y_pre.reshape(4,1) y_pre=y_pre[:,0] #画图 #展示在测试集上的表现 draw=pd.concat([pd.DataFrame(y_test),pd.DataFrame(y_pre)],axis=1); draw.iloc[:,0].plot(figsize=(12,6)) draw.iloc[:,1].plot(figsize=(12,6)) plt.legend(('real', 'predict'),loc='upper right',fontsize='15') plt.title("Test Data",fontsize='30') #添加标题 #输出精度指标 print('测试集上的MAE/MSE') print(mean_absolute_error(y_pre, y_test)) print(mean_squared_error(y_pre, y_test) ) mape = np.mean(np.abs((y_pre-y_test)/(y_test)))*100 print('=============mape==============') print(mape,'%') # 画出真实数据和预测数据的对比曲线图 print("R2 = ",metrics.r2_score(y_test, y_pre)) # R2 运行上述程序。在下面这一步中draw=pd.concat([pd.DataFrame(y_test),pd.DataFrame(y_pre)],axis=1);我需要将归一化的数据变成真实值，输出对比图，该怎么修改程序

在将归一化的数据变回真实值的过程中，需要将归一化的因变量（即最后一列）逆转换回来，以得到真实的预测值和真实值。代码如下： ``` # 将预测结果和真实结果逆归一化 y_predict = min_max_scaler.inverse_transform(y_pre.reshape(-1, 1)) y_test = min_max_scaler.inverse_transform(y_test.reshape(-1, 1)) # 画图 draw=pd.concat([pd.DataFrame(y_test), pd.DataFrame(y_predict)], axis=1) draw.iloc[:,0].plot(figsize=(12,6)) draw.iloc[:,1].plot(figsize=(12,6)) plt.legend(('real', 'predict'), loc='upper right', fontsize='15') plt.title("Test Data", fontsize='30') # 输出精度指标 print('测试集上的MAE/MSE') print(mean_absolute_error(y_predict, y_test)) print(mean_squared_error(y_predict, y_test)) mape = np.mean(np.abs((y_predict-y_test)/(y_test)))*100 print('=============mape==============') print(mape,'%') # 输出R2分数 print("R2 = ", metrics.r2_score(y_test, y_predict)) ``` 在此代码中，我们使用了 MinMaxScaler 对象的 inverse_transform() 方法将归一化的结果转换回原始的数据范围。运行修改后的代码，即可得到真实值与预测值的对比图，以及各种精度指标的输出。

阅读全文

优化下列代码from sklearn import preprocessing min_max_scaler = preprocessing.MinMaxScaler() df0=min_max_scaler.fit_transform(df1) df = pd.DataFrame(df0, columns=df1.columns) X=df.iloc[:,:-1] y=df['target']#切片是前闭后开[) print(X.shape) print(y.shape)

相关推荐

sklearn：sklearn.preprocessing的MinMaxScaler简介、使用方法之详细攻略

ANN.zip_sklearn_sklearn ANN_skleran ann_神经网络 分类

data_prepro.zip_EEG_EEG preprocessing_脑电_脑电程序_脑电预处理

# 对数值列进行最小-最大归一化 numeric_cols1 = df1.select_dtypes(include='number').columns df1[numeric_cols1] = (df1[numeric_cols1] - df1[numeric_cols1].min()) / (df1[numeric_cols1].max() - df1[numeric_cols1].min()) 怎么把df1的所有数据画到一幅折线图上

基于python数据分析技术的数据整理与分析研究.docx

【Advanced篇】Web Scraper Data Cleaning and Preprocessing Techniques: Data Cleaning and ...

【数据融合的业务价值】：ISO_IEC 23150如何推动业务增长

【pandas专家之路】：行_列删除与选取的最佳实践

【数据融合中的安全问题】：ISO_IEC 23150确保数据安全的策略

【Pandas工作流优化】：合并求和与新行_列添加的高效策略

【自动化分析解决方案】：用Kappa-minitab与R_Python打造自动化分析流水线

【统计分析新手必看】：利用Scipy.stats快速掌握数据探索技巧

【数据合并进阶】：pd.concat与其他函数结合，实现复杂数据操作

数据整合的艺术揭秘：从Data+Sheet.pdf看如何优雅地整合信息

all_majors = pd.concat([ dfs[0]['当前专业'], dfs[2]['专业'], dfs[1]['专业名称'] ]).unique() self.major_encoder.fit(all_majors)这个函数是干嘛用的

大家在看

select图片下拉框

Jtopo demo

linphone 4.1.1 SDK，C# Demo封装包，包含封装CS文件和所需要Dll，直接拉入项目即可

pb调用支付宝接口的例子

IFPUG工作量算法总结.pdf

最新推荐

学校图书馆管理系统JspLibrary

全面掌握Oracle9i：基础教程与实践指南

【数据融合技术】：甘肃土壤类型空间分析中的专业性应用

模糊大津法

SOA服务设计原则：2007年7月版原理深入解析

【空间分布规律】：甘肃土壤类型与农业生产的关联性研究

rc滤波导致相位

FTP搜索工具：IP检测与数据库管理功能详解

【制图技术】：甘肃高质量土壤分布TIF图件的成图策略

iperf命令-t最多能设置多大

ANN.zip_sklearn_sklearn ANN_skleran ann_神经网络分类