基于sklearn回归数据实现线性回归模型的构建、训练及预测
时间: 2025-07-06 16:48:24 浏览: 9
### 使用 Sklearn 构建、训练和预测线性回归模型
#### 导入必要的库
为了构建线性回归模型,首先需要导入所需的 Python 库。这些库包括 `numpy` 用于数值计算,`pandas` 用来处理数据集以及 `sklearn.linear_model.LinearRegression` 来创建线性回归实例。
```python
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
```
#### 准备数据集
假设有一个简单的二维数组作为输入特征 X 和相应的标签 y 表示目标变量。这里可以使用真实的数据集或者合成的数据来进行练习。对于实际项目来说,通常会加载 CSV 文件或其他形式存储的真实世界数据[^2]。
```python
# 示例:生成一些随机样本点作为演示用途
np.random.seed(0)
X = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)
# 将数据划分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
```
#### 创建并拟合模型
通过调用 `LinearRegression()` 方法初始化一个新的线性回归对象,并利用 `.fit()` 方法传入训练数据完成模型参数的学习过程。这一步骤使得模型能够找到最佳拟合直线以描述给定的观测值之间的关系[^3]。
```python
lin_reg = LinearRegression()
lin_reg.fit(X_train, y_train.ravel())
```
#### 进行预测
一旦完成了模型的训练工作之后就可以基于已知的新输入去估计未知的目标输出了。此时只需简单地调用 `.predict()` 即可获得对应于新输入位置处的目标响应值。
```python
new_X = [[7]] # 假设我们要预测当 x=7 时的情况
predicted_y = lin_reg.predict(new_X)
print(f'Predicted value at {new_X}:', predicted_y)
```
#### 查看模型属性
除了做预测之外还可以访问模型内部的一些重要特性比如截距项(即常数偏置 b₀)和平移量(权重 w₁)。这对于理解所建立起来的关系至关重要。
```python
print('Intercept:', lin_reg.intercept_)
print('Coefficient:', lin_reg.coef_)
```
阅读全文
相关推荐


















