import numpy as np from sklearn.datasets import make_regression from sklearn.model_selection import train_test_split np.random.seed(1) def lr(x_train, x_test, y_train, y_test): """ :param x_train: 训练集 :param x_test: 训练集标签 :param y_train: 测试集 :param y_test: 测试集标签 :return: 预测值与测试集标签的均方误差 """ # 请根据提示在下面补全代码 # ********** Begin ********* # # 使用正规方程公式求得theta # 使用theta预测结果 # 求出预测值与目标值的均方误差 # ********** End ********* # return mse if __name__ == '__main__': X, Y = make_regression(n_samples=500, n_features=1, n_targets=1, noise=1.5) x_train, x_test, y_train, y_test = train_test_split(X, Y) mse = lr(x_train, x_test, y_train, y_test) print(mse)编写一个利用正规方程进行线性回归预测的程序。

时间: 2025-05-26 22:08:21 浏览: 16
### 正规方程实现线性回归预测 以下是基于正规方程实现线性回归预测的完整代码示例,其中包括模型训练、预测以及均方误差的计算。 ```python import numpy as np from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler from sklearn.metrics import mean_squared_error # 数据生成 (假设我们有一个简单的二维数据集) np.random.seed(42) X = 2 * np.random.rand(100, 1) # 特征矩阵 X y = 4 + 3 * X + np.random.randn(100, 1) # 目标变量 y 添加噪声 # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 数据标准化 scaler_X = StandardScaler() scaler_y = StandardScaler() X_train_scaled = scaler_X.fit_transform(X_train) X_test_scaled = scaler_X.transform(X_test) y_train_scaled = scaler_y.fit_transform(y_train).ravel() # 将形状调整为一维数组 y_test_scaled = scaler_y.transform(y_test).ravel() # 增加偏置项 (添加一列全为1的向量) X_b_train = np.c_[np.ones((X_train_scaled.shape[0], 1)), X_train_scaled] X_b_test = np.c_[np.ones((X_test_scaled.shape[0], 1)), X_test_scaled] # 计算正规方程求解最优参数 θ theta_best = np.linalg.inv(X_b_train.T.dot(X_b_train)).dot(X_b_train.T).dot(y_train_scaled) # 正规方程公式[^2] print(f"最佳回归系数: {theta_best}") # 预测 y_lin_predict_scaled = X_b_test.dot(theta_best) # 反标准化预测值 y_lin_predict = scaler_y.inverse_transform(y_lin_predict_scaled.reshape(-1, 1)) # 计算均方误差 mse = mean_squared_error(y_test, y_lin_predict) print(f"正规方程的均方误差:{mse}") ``` ### 解析说明 上述代码实现了以下几个功能: 1. **数据准备** 创建了一个简单的一元线性回归数据集 `X` 和目标变量 `y`,其中加入了随机噪声以模拟真实世界中的不确定性[^4]。 2. **数据预处理** 对特征 `X` 和目标变量 `y` 进行了标准化操作,以便提高数值稳定性。这一步对于正规方程尤其重要,因为其涉及矩阵运算[^1]。 3. **增加偏置项** 使用 `np.c_` 方法在特征矩阵前加入一列常数 `1`,用于表示截距项 \( \beta_0 \)[^3]。 4. **正规方程求解** 应用了正规方程的核心公式: \[ \theta = (X^\top X)^{-1} X^\top y \] 来直接计算出最优的回归系数 \( \theta \),无需迭代过程[^2]。 5. **反标准化与评估** 将预测结果从标准化空间映射回原始空间,并利用均方误差(MSE)来衡量模型性能[^1]。 --- ###
阅读全文

相关推荐

最新推荐

recommend-type

本科毕业设计论文--操作系统课程设计报告进程调度算法模拟(1).doc

本科毕业设计论文--操作系统课程设计报告进程调度算法模拟(1).doc
recommend-type

基于非标自动化机械设计管控的策略探究(1).docx

基于非标自动化机械设计管控的策略探究(1).docx
recommend-type

可测性设计及DFT软件的使用(1).pptx

可测性设计及DFT软件的使用(1).pptx
recommend-type

第5章-FX系列基本指令及编程讲课教案(1).ppt

第5章-FX系列基本指令及编程讲课教案(1).ppt
recommend-type

信息技术excel说课稿(1).docx

信息技术excel说课稿(1).docx
recommend-type

单片机实验开发板程序编写指南

单片机实验程序的知识点可以从单片机的概念、开发板的作用、实验的目的以及具体程序编写与调试方面进行详细阐述。 首先,单片机(Single-Chip Microcomputer),又称微控制器,是将中央处理单元(CPU)、随机存取存储器(RAM)、只读存储器(ROM)、输入输出接口等主要计算机功能部件集成在一片芯片上的微小型计算机。它具备独立处理特定任务的能力,广泛应用于嵌入式系统中。单片机由于其成本低廉、体积小、功耗低、控制简单等特点,被广泛应用于家用电器、办公自动化、汽车电子、工业控制等众多领域。 接着,开发板(Development Board)是为了方便开发者使用单片机而设计的一种实验平台,通常集成了单片机、电源管理模块、外围接口电路、调试接口、编程接口等。开发板的主要作用是提供一个简洁的硬件环境,让开发者可以更容易地进行实验、测试和程序开发。在使用开发板进行单片机实验时,可以通过编程器将用户编写的程序烧录到单片机中,然后进行实际操作和测试。 实验的目的通常是为了验证某些特定的功能或者算法。在实验中,开发者可以使用单片机开发板来实现对输入信号的检测、处理和输出控制。例如,可以编写程序使单片机控制LED灯的亮灭,或者读取按键输入并根据按键的不同进行不同的控制。实验程序可以是一个简单的循环处理,也可以是复杂的算法实现,如数据通信、中断处理、定时器使用等。 在编写单片机实验程序时,首先需要了解所使用的单片机的指令集和硬件资源。以常用的8051单片机为例,需要熟悉其寄存器配置、特殊功能寄存器(SFR)的使用以及I/O口操作等。编写程序时,通常会使用C语言或者汇编语言。C语言因其可读性好、编写效率高而更受欢迎。开发者可以使用Keil uVision、IAR Embedded Workbench等集成开发环境(IDE)来编写、编译和调试代码。 在程序调试阶段,可以通过开发板上的调试接口,如JTAG、ISP等,将编译好的程序下载到单片机中。调试过程通常包括设置断点、单步执行、查看寄存器和内存内容等操作。通过调试可以发现并修正程序中的逻辑错误或硬件交互问题。 另外,为了保证程序的可靠性和稳定性,实验程序设计时还应考虑异常处理、资源管理以及功耗优化等因素。编写高效的单片机程序不仅仅是让程序按预期运行,还要考虑到程序运行的效率、资源消耗以及对异常情况的应对。 总之,基于开发板的单片机实验程序开发涉及到硬件理解、软件编程、程序调试等多个环节。开发者需要将理论知识与实际操作相结合,通过不断的学习和实践,掌握单片机编程和应用开发的关键技能。这不仅需要对单片机的基础知识有深入的了解,还需要对开发板的功能和特性有充分的认识,从而能够设计出高效、稳定和实用的单片机应用系统。
recommend-type

【性能测试基准】:为RK3588选择合适的NVMe性能测试工具指南

# 1. NVMe性能测试基础 ## 1.1 NVMe协议简介 NVMe,全称为Non-Volatile Memory Express,是专为固态驱动器设计的逻辑设备接口规范。与传统的SATA接口相比,NVMe通过使用PCI Express(PCIe)总线,大大提高了存储设备的数据吞吐量和IOPS(每秒输入输出操作次数),特别适合于高速的固态存储设备。
recommend-type

ubuntu 检查下载源

<think>我们正在讨论Ubuntu系统中检查和配置下载源(软件源)的方法。用户的需求很明确:如何检查当前配置的下载源,以及如何修改它们。根据引用[1]和[2]中的信息,我们知道在Ubuntu中,软件源配置存储在`/etc/apt/sources.list`文件中以及`/etc/apt/sources.list.d/`目录下的额外文件中。修改源通常包括备份当前配置、编辑源列表文件、更新软件包列表等步骤。步骤分解:1.检查当前下载源:可以通过查看`sources.list`文件和`sources.list.d/`目录中的文件内容来实现。2.修改下载源:包括备份、编辑源列表(替换为新的镜像源地址
recommend-type

办公软件:下载使用指南与资源包

标题中提到的“offices办公软件”,指的是Office套件,这是一系列办公应用程序的集合,通常包括文字处理软件(如Microsoft Word)、电子表格软件(如Microsoft Excel)、演示文稿制作软件(如Microsoft PowerPoint),以及邮件管理软件等。该软件包旨在帮助用户提高工作效率,完成文档撰写、数据分析、演示制作等多种办公任务。 描述部分非常简单,提到“一个很好公办软件你一定很爱他快来下载吧加强团结”,表达了对软件的高度评价和期待用户下载使用,以促进工作中的团结协作。不过,这段描述中可能存在错别字或排版问题,正确的表达可能是“一款非常好的办公软件,你一定很爱它,快来下载吧,加强团结”。 标签部分为“dddd”,这显然不是一个有效的描述或分类标签,它可能是由于输入错误或者故意设置的占位符。 压缩包子文件的文件名称列表中包含了以下文件: - keygen.exe:这是一个序列号生成器的可执行文件,通常用于生成软件的注册码或激活码,使得用户能够在不支付授权费用的情况下使用某些付费软件。然而,这通常是违反软件许可协议的行为,也可能涉及到法律风险。 - 说明_Readme.html:这是一个HTML格式的说明文件,通常会包含该软件的安装指南、使用方法、版本信息、已知问题、版权声明和致谢等内容。阅读这个文件可以帮助用户正确安装和使用软件。 - OfficeSuite 4_50.sis:这是一个适用于Symbian操作系统的安装包文件,SIS是Symbian Install File的缩写。从文件名可以看出,这是一个名为“OfficeSuite”的软件的第50个版本,版本号为4.0。Symbian曾是智能手机操作系统之一,通常用于诺基亚等品牌的设备上,但随着智能手机市场的变化,现在已很少见,市场上主流的智能手机操作系统已转向Android和iOS。 - resource:这个名称很模糊,没有文件扩展名,因此无法确定具体是什么类型的资源。它可能是一个包含字体、图像或其他资源文件的文件夹,这些资源文件用于支持Office套件在不同设备或操作系统上的运行。 在使用这些文件时,特别是涉及到keygen.exe这类软件时,用户应谨慎行事。应避免使用未经授权的软件,不仅因为其可能违反法律,还可能对计算机系统造成安全风险。在下载和安装任何软件时,应确保来源的可靠性,并从官方渠道获取正版授权。此外,对于已经过时或不再受支持的软件,比如针对Symbian系统的OfficeSuite,用户可能需要寻找其他替代方案来满足当前的办公需求。
recommend-type

【固态硬盘寿命延长】:RK3588平台NVMe维护技巧大公开

# 1. 固态硬盘寿命延长的基础知识 ## 1.1 固态硬盘的基本概念 固态硬盘(SSD)是现代计算设备中不可或缺的存储设备之一。与传统的机械硬盘(HDD)相比,SSD拥有更快的读写速度、更小的体积和更低的功耗。但是,SSD也有其生命周期限制,主要受限于NAND闪存的写入次数。 ## 1.2 SSD的写入次数和寿命 每块SSD中的NAND闪存单元都有有限的写入次数。这意味着,随着时间的推移,SSD的