0% found this document useful (0 votes)

27 views7 pages

Tutorial 7.ipynb - Colab

Uploaded by

prasadgade469

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

27 views7 pages

Tutorial 7.ipynb - Colab

Uploaded by

prasadgade469

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 7

10/13/24, 7:07 PM 2024301006 Tutorial 7.

ipynb - Colab

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
from sklearn.preprocessing import RobustScaler

data = pd.read_csv('linear_regression-100.csv')
data = data.sort_values('x')

X=pd.DataFrame(data['x'])
y=pd.DataFrame(data['y'])

from sklearn.preprocessing import RobustScaler

scaler = RobustScaler()
y = scaler.fit_transform(y)

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

plt.scatter(X, y, color='blue', label='Data')

plt.title('Data from CSv')
plt.xlabel('X')
plt.ylabel('y')
plt.legend()
plt.show()

linear_model = LinearRegression()
linear_model.fit(X_train, y_train)

▾ LinearRegression i ?
LinearRegression()

y_pred_train_linear = linear_model.predict(X_train)
y_pred_test_linear = linear_model.predict(X_test)

plt.scatter(X, y, color='blue', label='Data')

plt.plot(X, linear_model.predict(X), color='red', label='Linear fit ')
plt.title('Linear Regression:')
plt.xlabel('X')
plt.ylabel('y')

https://colab.research.google.com/drive/1HIYJoWVI4prgwPTk2LO9k01MPMpOm4QR#scrollTo=nnyFDPi--q6j&printMode=true 1/7
10/13/24, 7:07 PM 2024301006 Tutorial 7.ipynb - Colab
plt.legend()
plt.show()

mse_train = mean_squared_error(y_train, y_pred_train_linear)

mse_linear = mean_squared_error(y_test, y_pred_test_linear)

bias_train = np.mean(y_pred_train_linear - y_train)

bias_test = np.mean(y_pred_test_linear - y_test)

variance_train = np.var(y_pred_train_linear)
variance_test = np.var(y_pred_test_linear)
print(f'Mean Squared Error Train (Linear Regression): {mse_train}')
print("Bias (Train):", bias_train)
print("Variance (Train):", variance_train)

print(f'Mean Squared Error Test (Linear Regression): {mse_linear}')

print("Bias (Test):", bias_test)
print("Variance (Test):", variance_test)

Mean Squared Error Train (Linear Regression): 5.141007291223486

Bias (Train): 8.152209066533292e-16
Variance (Train): 4.397649185731088
Mean Squared Error Test (Linear Regression): 6.818406388680551
Bias (Test): -0.023000954542939617
Variance (Test): 3.765210102931741

poly_features = PolynomialFeatures(degree=5)
X_poly_train = poly_features.fit_transform(X_train)
X_poly_test = poly_features.transform(X_test)

poly_model = LinearRegression()
poly_model.fit(X_poly_train, y_train)

y_pred_train_poly = poly_model.predict(X_poly_train)
y_pred_test_poly = poly_model.predict(X_poly_test)

mse_train_poly = mean_squared_error(y_train, y_pred_train_poly)

mse_test_poly = mean_squared_error(y_test, y_pred_test_poly)

print("MSE (Train):", mse_train_poly)

print("MSE (Test):", mse_test_poly)

bias_train = (y_train - y_pred_train_poly).mean()

bias_test = (y_test - y_pred_test_poly).mean()
# bias_test = np.mean(y_test) - np.mean(y_pred_test_poly)

print("Bias (Train):", bias_train)

print("Bias (Test):", bias_test)

https://colab.research.google.com/drive/1HIYJoWVI4prgwPTk2LO9k01MPMpOm4QR#scrollTo=nnyFDPi--q6j&printMode=true 2/7
10/13/24, 7:07 PM 2024301006 Tutorial 7.ipynb - Colab

variance_train = np.var(y_pred_train_poly)
variance_test = np.var(y_pred_test_poly)

print("Variance (Train):", variance_train)

print("Variance (Test):", variance_test)

plt.scatter(X, y, color='blue', label='Data')

plt.plot(X, poly_model.predict(poly_features.transform(X)), color='red', linewidth=1, label='Polynomial fit (degree=5)')
plt.title('Polynomial Regression: Degree 5')
plt.xlabel('X')
plt.ylabel('y')
plt.legend()
plt.show()

MSE (Train): 1.23110433047544e-27

MSE (Test): 9.957037959354165e-28
Bias (Train): -3.408731630294426e-16
Bias (Test): -5.0637734746080316e-15
Variance (Train): 9.53865647695457
Variance (Test): 12.939110061091156

Interpretation:

The train and test MSE values are quite close, which suggests that the model generalizes well and is not severely overfitting. However, both
MSE values are quite low, indicating the model is capturing the data patterns effectively.

Training Bias is extremely small, nearly zero, meaning the model fits the training data very closely without underfitting.

Test Bias is slightly larger, but still relatively low. This suggests that the model is performing well in terms of the overall fit to the test data, with
only a small deviation from perfect predictions.

Both Train Variance and Test Variance are high, indicating that the model’s predictions are sensitive to small fluctuations in the input data.

Despite the low test MSE and relatively low test bias, the high variance suggests that this degree 10 polynomial model is at risk of overfitting.
The model is very sensitive to variations in the data, and while it performs well on both the training and test sets, its ability to generalize to new,
unseen data could be compromised by this high variance.

data = pd.read_csv('linear_regression-1000.csv')
data = data.sort_values('x')
X = data['x'].values.reshape(-1, 1)
y = data['y'].values

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

plt.scatter(X, y, color='blue', label='Data')

plt.title('Data from CSv')
plt.xlabel('X')

https://colab.research.google.com/drive/1HIYJoWVI4prgwPTk2LO9k01MPMpOm4QR#scrollTo=nnyFDPi--q6j&printMode=true 3/7
10/13/24, 7:07 PM 2024301006 Tutorial 7.ipynb - Colab
plt.ylabel('y')
plt.legend()
plt.show()

linear_model = LinearRegression()
linear_model.fit(X_train, y_train)

▾ LinearRegression i ?
LinearRegression()

y_pred_train_linear = linear_model.predict(X_train)
y_pred_test_linear = linear_model.predict(X_test)

plt.scatter(X, y, color='blue', label='Data')

plt.plot(X, linear_model.predict(X), color='red', label='Linear fit ')
plt.title('Linear Regression:')
plt.xlabel('X')
plt.ylabel('y')
plt.legend()
plt.show()

mse_train = mean_squared_error(y_train, y_pred_train_linear)

mse_linear = mean_squared_error(y_test, y_pred_test_linear)

https://colab.research.google.com/drive/1HIYJoWVI4prgwPTk2LO9k01MPMpOm4QR#scrollTo=nnyFDPi--q6j&printMode=true 4/7
10/13/24, 7:07 PM 2024301006 Tutorial 7.ipynb - Colab

bias_train = np.mean(y_pred_train_linear - y_train)

bias_test = np.mean(y_pred_test_linear - y_test)

print(f'Mean Squared Error Test (Linear Regression): {mse_linear}')

print("Bias (Test):", bias_test)
print("Variance (Test):", variance_test)

Mean Squared Error Train (Linear Regression): 1.1489708443865773e+29

Bias (Train): 0.02
Variance (Train): 2.2381775497652546e+29
Mean Squared Error Test (Linear Regression): 1.2635468668932845e+29
Bias (Test): -15368810361049.688
Variance (Test): 2.3309459865999088e+29

https://colab.research.google.com/drive/1HIYJoWVI4prgwPTk2LO9k01MPMpOm4QR#scrollTo=nnyFDPi--q6j&printMode=true 5/7
10/13/24, 7:07 PM 2024301006 Tutorial 7.ipynb - Colab
degrees = range(1, 11,2)

train_errors, test_errors = [], []

train_bias, test_bias = [], []
train_variance, test_variance = [], []

for degree in degrees:

poly = PolynomialFeatures(degree)
X_poly_train = poly.fit_transform(X_train)
X_poly_test = poly.transform(X_test)

model = LinearRegression()
model.fit(X_poly_train, y_train)

y_train_pred = model.predict(X_poly_train)
y_test_pred = model.predict(X_poly_test)

train_mse = mean_squared_error(y_train, y_train_pred)

test_mse = mean_squared_error(y_test, y_test_pred)
train_errors.append(train_mse)
test_errors.append(test_mse)

train_bias_sq = np.mean((y_train_pred - y_train) ** 2)

test_bias_sq = np.mean((y_test_pred - y_test) ** 2)
train_bias.append(train_bias_sq)
test_bias.append(test_bias_sq)

train_var = np.var(y_train_pred)
test_var = np.var(y_test_pred)
train_variance.append(train_var)
test_variance.append(test_var)

plt.figure(figsize=(12, 6))
plt.subplot(1, 2, 1)
plt.plot(degrees, train_errors, label='Train MSE', marker='o')
plt.plot(degrees, test_errors, label='Test MSE', marker='o')
plt.xlabel('Polynomial Degree')
plt.ylabel('Mean Squared Error')
plt.title('MSE vs. Polynomial Degree')
plt.legend()
plt.grid(True)

plt.subplot(1, 2, 2)
plt.plot(degrees, train_bias, label='Train Bias^2', marker='o')
plt.plot(degrees, test_bias, label='Test Bias^2', marker='o')
plt.plot(degrees, train_variance, label='Train Variance', marker='o')
plt.plot(degrees, test_variance, label='Test Variance', marker='o')
plt.xlabel('Polynomial Degree')
plt.ylabel('Bias^2 / Variance')
plt.title('Bias^2 and Variance vs. Polynomial Degree')
plt.legend()
plt.grid(True)

plt.tight_layout()
plt.show()

https://colab.research.google.com/drive/1HIYJoWVI4prgwPTk2LO9k01MPMpOm4QR#scrollTo=nnyFDPi--q6j&printMode=true 6/7
10/13/24, 7:07 PM 2024301006 Tutorial 7.ipynb - Colab

Above MSE vs Polynomial Drgree Graph SUggests that the MSE is least at a polynomial of degree 5, thus using a polynomial regression model
with degree 5 would be good option.

poly_features = PolynomialFeatures(degree=5)
X_poly_train = poly_features.fit_transform(X_train)
X_poly_test = poly_features.transform(X_test)

poly_model = LinearRegression()
poly_model.fit(X_poly_train, y_train)

y_pred_train_poly = poly_model.predict(X_poly_train)
y_pred_test_poly = poly_model.predict(X_poly_test)

mse_train_poly = mean_squared_error(y_train, y_pred_train_poly)

mse_test_poly = mean_squared_error(y_test, y_pred_test_poly)

print("MSE (Train):", mse_train_poly)

print("MSE (Test):", mse_test_poly)

bias_train = (y_train - y_pred_train_poly).mean()

bias_test = (y_test - y_pred_test_poly).mean()

print("Bias (Train):", bias_train)

print("Bias (Test):", bias_test)

variance_train = np.var(y_pred_train_poly)

# Variance for the test set

variance_test = np.var(y_pred_test_poly)

print("Variance (Train):", variance_train)

print("Variance (Test):", variance_test)

plt.scatter(X, y, color='blue', label='Data')

plt.plot(X, poly_model.predict(poly_features.transform(X)), color='red', linewidth=4, label='Polynomial fit (degree=5)')
plt.title('Polynomial Regression: Degree 5')
plt.xlabel('X')
plt.ylabel('y')
plt.legend()
plt.show()

MSE (Train): 1024506.1521971822

MSE (Test): 991863.2572999481
Bias (Train): 0.011173361582545373
Bias (Test): 27.818454353462034
Variance (Train): 3.387148394151828e+29
Variance (Test): 3.9410143898299956e+29

https://colab.research.google.com/drive/1HIYJoWVI4prgwPTk2LO9k01MPMpOm4QR#scrollTo=nnyFDPi--q6j&printMode=true 7/7

Practicalpgm ML
No ratings yet
Practicalpgm ML
33 pages
Supervised Learning For Data Science...
No ratings yet
Supervised Learning For Data Science...
14 pages
EX. NO: 4 Exploring Regression Performance With Kernel Function DATE: 28/08/2024
No ratings yet
EX. NO: 4 Exploring Regression Performance With Kernel Function DATE: 28/08/2024
9 pages
Assignment 2
No ratings yet
Assignment 2
3 pages
ML Lab Manual
No ratings yet
ML Lab Manual
17 pages
Ai 28-01-25
No ratings yet
Ai 28-01-25
18 pages
Data Analytics
No ratings yet
Data Analytics
10 pages
Simple Linear Regression
No ratings yet
Simple Linear Regression
11 pages
ML Internal Questions
No ratings yet
ML Internal Questions
15 pages
Linear Regression Besant
No ratings yet
Linear Regression Besant
11 pages
COMPARISON - Jupyter Notebook
No ratings yet
COMPARISON - Jupyter Notebook
5 pages
Btech1007022 Lab5.1
No ratings yet
Btech1007022 Lab5.1
9 pages
Dsbda 4
No ratings yet
Dsbda 4
4 pages
1
No ratings yet
1
13 pages
16BCB0126 VL2018195002535 Pe003
No ratings yet
16BCB0126 VL2018195002535 Pe003
40 pages
Logistic Regression
No ratings yet
Logistic Regression
3 pages
Data Mining Practicals
No ratings yet
Data Mining Practicals
22 pages
Linear Regression
No ratings yet
Linear Regression
11 pages
Btech1007022 Lab5
No ratings yet
Btech1007022 Lab5
14 pages
Assignment 1
No ratings yet
Assignment 1
5 pages
Zerox Ready
No ratings yet
Zerox Ready
21 pages
Naive Bayes
No ratings yet
Naive Bayes
58 pages
Print Out ML - Finallllllllllllllll
No ratings yet
Print Out ML - Finallllllllllllllll
11 pages
Overfitting and Underfitting in Python
No ratings yet
Overfitting and Underfitting in Python
7 pages
ML Remaining
No ratings yet
ML Remaining
17 pages
4
No ratings yet
4
1 page
Coding Questions
No ratings yet
Coding Questions
124 pages
ML Prac 1
No ratings yet
ML Prac 1
4 pages
Import As From Import From Import From Import: R'creditcard - CSV' 'Time' 'Time'
No ratings yet
Import As From Import From Import From Import: R'creditcard - CSV' 'Time' 'Time'
3 pages
AML Lab
No ratings yet
AML Lab
14 pages
Python Linear Regression Guide
No ratings yet
Python Linear Regression Guide
23 pages
Machine Learning
No ratings yet
Machine Learning
10 pages
Ann Experiential Learning
No ratings yet
Ann Experiential Learning
43 pages
C2W3 Lab 01 Model Evaluation and Selection
No ratings yet
C2W3 Lab 01 Model Evaluation and Selection
21 pages
C: Users Dell Downloads Salary - Data - CSV
No ratings yet
C: Users Dell Downloads Salary - Data - CSV
2 pages
C2W3 Lab 01 Model Evaluation and Selection
No ratings yet
C2W3 Lab 01 Model Evaluation and Selection
21 pages
Experiment No 8-Linear - Regression - Using - SKLEARN - Ipynb - Colaboratory
No ratings yet
Experiment No 8-Linear - Regression - Using - SKLEARN - Ipynb - Colaboratory
2 pages
Linearregression SVM
No ratings yet
Linearregression SVM
3 pages
ML Practicals
No ratings yet
ML Practicals
11 pages
Python File
No ratings yet
Python File
5 pages
Program
No ratings yet
Program
3 pages
Shobit Sharma (2124399) ML Lab File PDF
No ratings yet
Shobit Sharma (2124399) ML Lab File PDF
19 pages
LR
No ratings yet
LR
2 pages
Lab On ML Print-Set-2022
No ratings yet
Lab On ML Print-Set-2022
10 pages
Machine Learning Hands-On
100% (1)
Machine Learning Hands-On
18 pages
Machine Learning Model Evaluation
No ratings yet
Machine Learning Model Evaluation
437 pages
Experiment 1
No ratings yet
Experiment 1
19 pages
ML Lab Prgms Split
No ratings yet
ML Lab Prgms Split
3 pages
Linear Regression - Cheatsheet
No ratings yet
Linear Regression - Cheatsheet
8 pages
Linear Regression
No ratings yet
Linear Regression
6 pages
Linear - Regression - Insuarace - StudentsPerformance
No ratings yet
Linear - Regression - Insuarace - StudentsPerformance
4 pages
Mlda - Lab
No ratings yet
Mlda - Lab
35 pages
Exp. 1
No ratings yet
Exp. 1
4 pages
Linear and Logistic Regression
No ratings yet
Linear and Logistic Regression
6 pages
MLR Example 2predictors
No ratings yet
MLR Example 2predictors
5 pages
Aiml Ex 4-7
No ratings yet
Aiml Ex 4-7
8 pages
SimpleLinear Regression
No ratings yet
SimpleLinear Regression
2 pages
ML
No ratings yet
ML
17 pages
Statistical Inference
No ratings yet
Statistical Inference
29 pages
Statistics Made Easy
100% (5)
Statistics Made Easy
412 pages
MINIMUM DETECTABLE EFFECTS A Simple Way To Report The Statistical Power of Experimental Designs
No ratings yet
MINIMUM DETECTABLE EFFECTS A Simple Way To Report The Statistical Power of Experimental Designs
10 pages
Mann Whitney U Test Sir Palomar
No ratings yet
Mann Whitney U Test Sir Palomar
13 pages
Science Learning Intervention Analysis
No ratings yet
Science Learning Intervention Analysis
5 pages
Assignment 5
No ratings yet
Assignment 5
9 pages
Correlation and Path Analysis
No ratings yet
Correlation and Path Analysis
14 pages
Chapter 5 - 2010
No ratings yet
Chapter 5 - 2010
8 pages
Econometrics
No ratings yet
Econometrics
22 pages
MODULE 5 and 6 STATISTICS AND PROBABILITY - Docx (1) - PDF
100% (2)
MODULE 5 and 6 STATISTICS AND PROBABILITY - Docx (1) - PDF
9 pages
ST130 Basic Statistics Assignment
No ratings yet
ST130 Basic Statistics Assignment
2 pages
Conditional Expectation Quiz
No ratings yet
Conditional Expectation Quiz
4 pages
Business Statistics Assignments
No ratings yet
Business Statistics Assignments
2 pages
Efektivitas Penerapan Sistem Operasi Berbasis Linux Ubuntu Hamzanwadi V.14 Untuk Meningkatkan Hasil Belajar Mahasiswa
No ratings yet
Efektivitas Penerapan Sistem Operasi Berbasis Linux Ubuntu Hamzanwadi V.14 Untuk Meningkatkan Hasil Belajar Mahasiswa
12 pages
Lecture 9 - Parametric Statistics (Teaching)
No ratings yet
Lecture 9 - Parametric Statistics (Teaching)
10 pages
Tema I (Mínimos Cuadrados Ordinarios)
No ratings yet
Tema I (Mínimos Cuadrados Ordinarios)
49 pages
Final Psych 625 Statistics Project Part Two
No ratings yet
Final Psych 625 Statistics Project Part Two
4 pages
Practice Questions - Multiple Linear Regression
100% (10)
Practice Questions - Multiple Linear Regression
44 pages
Random Fixed Effects Sem
No ratings yet
Random Fixed Effects Sem
20 pages
9 - Functional Data Analysis With Application To Periodically
No ratings yet
9 - Functional Data Analysis With Application To Periodically
13 pages
Normalitas Dan ANOVA
No ratings yet
Normalitas Dan ANOVA
2 pages
Simulation-Based Sample-Size Calculation For Designing New Clinical Trials and Diagnostic Test Accuracy Studies To Update An Existing Meta-Analysis
No ratings yet
Simulation-Based Sample-Size Calculation For Designing New Clinical Trials and Diagnostic Test Accuracy Studies To Update An Existing Meta-Analysis
26 pages
Analytics Methods in RFID Technology
No ratings yet
Analytics Methods in RFID Technology
9 pages
Me29 6
No ratings yet
Me29 6
36 pages
Properties of Least Squares Estimators
No ratings yet
Properties of Least Squares Estimators
21 pages
Intro to Statistics & Probability
100% (1)
Intro to Statistics & Probability
44 pages
Hypothesis Testing by Example Hands On Approach Using R
No ratings yet
Hypothesis Testing by Example Hands On Approach Using R
39 pages
Advanced Econometrics: Week 1
No ratings yet
Advanced Econometrics: Week 1
101 pages
Chapter 12
No ratings yet
Chapter 12
36 pages
Iiyy
No ratings yet
Iiyy
10 pages

Tutorial 7.ipynb - Colab

Uploaded by

Tutorial 7.ipynb - Colab

Uploaded by

10/13/24, 7:07 PM 2024301006 Tutorial 7.

from sklearn.preprocessing import RobustScaler

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

plt.scatter(X, y, color='blue', label='Data')

plt.scatter(X, y, color='blue', label='Data')

mse_train = mean_squared_error(y_train, y_pred_train_linear)

bias_train = np.mean(y_pred_train_linear - y_train)

print(f'Mean Squared Error Test (Linear Regression): {mse_linear}')

Mean Squared Error Train (Linear Regression): 5.141007291223486

mse_train_poly = mean_squared_error(y_train, y_pred_train_poly)

print("MSE (Train):", mse_train_poly)

bias_train = (y_train - y_pred_train_poly).mean()

print("Bias (Train):", bias_train)

print("Variance (Train):", variance_train)

plt.scatter(X, y, color='blue', label='Data')

MSE (Train): 1.23110433047544e-27

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

plt.scatter(X, y, color='blue', label='Data')

plt.scatter(X, y, color='blue', label='Data')

mse_train = mean_squared_error(y_train, y_pred_train_linear)

bias_train = np.mean(y_pred_train_linear - y_train)

print(f'Mean Squared Error Test (Linear Regression): {mse_linear}')

Mean Squared Error Train (Linear Regression): 1.1489708443865773e+29

train_errors, test_errors = [], []

for degree in degrees:

train_mse = mean_squared_error(y_train, y_train_pred)

train_bias_sq = np.mean((y_train_pred - y_train) ** 2)

mse_train_poly = mean_squared_error(y_train, y_pred_train_poly)

print("MSE (Train):", mse_train_poly)

bias_train = (y_train - y_pred_train_poly).mean()

print("Bias (Train):", bias_train)

# Variance for the test set

print("Variance (Train):", variance_train)

plt.scatter(X, y, color='blue', label='Data')

MSE (Train): 1024506.1521971822

You might also like