AI1001 Assignment 9

The document discusses model selection and optimization, emphasizing the importance of choosing the right model to explain data complexity while avoiding underfitting and overfitting. It covers techniques such as cross-validation, bias-variance tradeoff, regularization methods (L1, L2, and elastic net), and hyperparameter tuning strategies like grid search, random search, and Bayesian optimization. Practical considerations for model selection include starting with simple models, using regularization, and ensuring a separate test set for final evaluation.

Uploaded by

ugkgjtebuzgmwycymj

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

15 views2 pages

AI1001 Assignment 9

Uploaded by

ugkgjtebuzgmwycymj

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Assignment 9: Model Selections and Optimization

Arnav Govindu
[email protected]

Model Selection
The goal of model selection is to identify a hypothesis or model that explains the data while covering
the complexity involved. One has to explore different models and variations in a model family, like
decision trees, neural networks,etc.

Hypothesis Space
This refers to the set of all possible models. For example, in polynomial regression, the degree of the
polynomial directly relates to its complexity.

Under and Over fitting

Underfitting is when the model is too simple and does not cover the entire complexity of the patterns
in the data, resulting in poor performance.
Overfitting is when the model is too complex and includes noise and unnecessary data in the training
data. This too, results in poor performance

Cross-Validation
This is a crucial technique to avoid overfitting. The dataset is split into k subsets (folds). The model
is trained on k-1 folds, and is validated on the remaining one. This process repeats k times, using a
different fold each time. This model is a more reliable estimate of the model’s error. Leave out one
cross validation (LOO-CV) is another version of k fold where each instance is used a validation set
once.

Bias-Variance Tradeoff
This is a key concept in model selection, which influences the model’s ability to generalize bias and
variance.
Bias is the error introduced by approximating real world problems with a simplified model.
Variance is the error introduced due to model complexity. High variance can cause overfitting.
A good model minimized bias and variance, while making sure generalization is optimized.

Regularization
Regularization is when a penalty is introduced for complex models. The penalty strength is controlled
by a hyperparameter ().

L2 Regulation
This regulation adds a penalty proportional to the square of the model parameters values.

L1 Regulation
This regulation adds a penalty proportional to the absolute values of the parameters

Elastic net
This is a combination of L1 and L2 regularization.
Hyperparameter Tuning
Hyperparameters are external configurations of a model, like depth of a decision tree, regularization
strength, etc. They are not learned during training and have to be optimized separately.
Grid search
A brute force method where all combinations of hyperparameters are exhaustively tested. It is
effective, but inefficient.
Random Search
Instead of trying every combination, random values for hyperparameters are tested. This can often be
more efficient.
Bayesian Optimization
This method uses a probabalistic approach by mapping hyperparameters to the objective and uses
this to choose the next set of hyperparameters to evaluate. This method is the most efficient out of the
mentioned ones.

Learning Curve
Learning curves are a useful tool to check if a model is underfitting or overfitting. If both training
and validaiton errors are high, the model is likely underfitting. If the training error is low but the
validation error is high, the model is likely overfitting. The chapter also discusses how increasing
the size of the model initially reduces training error, but eventually increases validation error as
overfitting starts to occur.

Practical Considerations
This section also includes practical advice on how to select models in real-world scenarios.
> Start with simple models and gradually increase complexity.
> Regularization is important to keep models from overfitting, especially in high dimensional datasets.
> Automated methods for hyperparameter tuning, like Bayesian optimization are highly efficient in
finding optimal solutions without trail and error.
> It is crucial to use a separate test set for final model evaluation to avoid biased estimates of
performance.

Unit 4
No ratings yet
Unit 4
34 pages
DSOST3
No ratings yet
DSOST3
31 pages
Jkkklphftbbhuii
No ratings yet
Jkkklphftbbhuii
17 pages
15-The Bias - Variance - Trade-Off-08-04-2024
No ratings yet
15-The Bias - Variance - Trade-Off-08-04-2024
23 pages
Model Selection NEW
No ratings yet
Model Selection NEW
24 pages
Theory in Machine Learning
No ratings yet
Theory in Machine Learning
60 pages
Topic 3
No ratings yet
Topic 3
48 pages
Training Evaluation
No ratings yet
Training Evaluation
42 pages
Model Parameters
No ratings yet
Model Parameters
26 pages
Model Validation in Machine Learning
100% (2)
Model Validation in Machine Learning
26 pages
Unit 3 ML
No ratings yet
Unit 3 ML
40 pages
Lec-1 Bias-variance-Tradeoff
No ratings yet
Lec-1 Bias-variance-Tradeoff
24 pages
ML-4 Cross Validation in Machine Learning
No ratings yet
ML-4 Cross Validation in Machine Learning
13 pages
ML UNIT 4 Notes
No ratings yet
ML UNIT 4 Notes
30 pages
MLquestions
No ratings yet
MLquestions
26 pages
Unit Ii ML
No ratings yet
Unit Ii ML
57 pages
Unit 5 New
No ratings yet
Unit 5 New
9 pages
Model Evaluation
No ratings yet
Model Evaluation
29 pages
Overfitting & Feature Engineering
No ratings yet
Overfitting & Feature Engineering
37 pages
Lect 03 Evaluation Part 2
No ratings yet
Lect 03 Evaluation Part 2
40 pages
Question1 Answers Complete
No ratings yet
Question1 Answers Complete
4 pages
Notes - Unit 3 - Machine Learning Lnctu-Bca (Aida) - IV Sem
No ratings yet
Notes - Unit 3 - Machine Learning Lnctu-Bca (Aida) - IV Sem
19 pages
SML Updated UNIT 4
No ratings yet
SML Updated UNIT 4
44 pages
ML Unit 2 Part 1
No ratings yet
ML Unit 2 Part 1
47 pages
Understanding Underfitting, Overfitting, and Capacity
No ratings yet
Understanding Underfitting, Overfitting, and Capacity
72 pages
Data Science Model Optimization
No ratings yet
Data Science Model Optimization
18 pages
Improving Machine Learning Performance
No ratings yet
Improving Machine Learning Performance
14 pages
Section 1: Cross-Validation and Model Performance
No ratings yet
Section 1: Cross-Validation and Model Performance
33 pages
Model Selection On ML
No ratings yet
Model Selection On ML
49 pages
Machine Learning Model Validation
No ratings yet
Machine Learning Model Validation
50 pages
Machine Learning Notes Anna University
No ratings yet
Machine Learning Notes Anna University
9 pages
Vsat2k - ML - Ch1a Evaluation of Learning Algorithms - Jan 2025
No ratings yet
Vsat2k - ML - Ch1a Evaluation of Learning Algorithms - Jan 2025
19 pages
Introduction To Machine Learning
No ratings yet
Introduction To Machine Learning
116 pages
Understanding Model Regularization in ML
No ratings yet
Understanding Model Regularization in ML
42 pages
Receiver Operator Characteristic
No ratings yet
Receiver Operator Characteristic
25 pages
A "Short" Introduction To Model Selection
No ratings yet
A "Short" Introduction To Model Selection
25 pages
ML MAKAUT Unit-3
No ratings yet
ML MAKAUT Unit-3
6 pages
Machine Learning
No ratings yet
Machine Learning
63 pages
MC4301 - ML Unit 2 (Model Evaluation and Feature Engineering)
No ratings yet
MC4301 - ML Unit 2 (Model Evaluation and Feature Engineering)
40 pages
Advanced AI & ML Model Selection Guide
No ratings yet
Advanced AI & ML Model Selection Guide
16 pages
Part 3
No ratings yet
Part 3
15 pages
AIML-Unit 5 Notes-Assignment 5
No ratings yet
AIML-Unit 5 Notes-Assignment 5
24 pages
ML Unit 4 Trupesh Patel
No ratings yet
ML Unit 4 Trupesh Patel
56 pages
Cross-Validation in Machine Learning
No ratings yet
Cross-Validation in Machine Learning
51 pages
Regularization CrossValidation
No ratings yet
Regularization CrossValidation
37 pages
ML MU Unit 2
100% (3)
ML MU Unit 2
84 pages
ML Unit 2
No ratings yet
ML Unit 2
35 pages
Model Generalization
No ratings yet
Model Generalization
117 pages
ML Chap 5
No ratings yet
ML Chap 5
14 pages
Lecture 9 - Evaluations
No ratings yet
Lecture 9 - Evaluations
68 pages
PCA for Dimensionality Reduction
No ratings yet
PCA for Dimensionality Reduction
19 pages
Csa202 Unit 2
No ratings yet
Csa202 Unit 2
36 pages
4-ResamplingMethods 1
No ratings yet
4-ResamplingMethods 1
23 pages
ML11 Generalization
No ratings yet
ML11 Generalization
40 pages
Lecture 9 Model Selection
No ratings yet
Lecture 9 Model Selection
15 pages
12 Bias-Variance - Underfit - Overfit
No ratings yet
12 Bias-Variance - Underfit - Overfit
4 pages
Module 3 Modified
No ratings yet
Module 3 Modified
48 pages
RO47002 - Lecture 2C - Hyperparameters and Cross-Validation
No ratings yet
RO47002 - Lecture 2C - Hyperparameters and Cross-Validation
10 pages
67780bc919503 ProdX - 2025 Round 2 Case File
No ratings yet
67780bc919503 ProdX - 2025 Round 2 Case File
2 pages
AI1001 Assignment 10
No ratings yet
AI1001 Assignment 10
1 page
AI1001 Assignment 3
No ratings yet
AI1001 Assignment 3
2 pages
AI1001 Assignment 2
No ratings yet
AI1001 Assignment 2
1 page
Feature Engineering Handout
No ratings yet
Feature Engineering Handout
33 pages
Relative Risk
No ratings yet
Relative Risk
4 pages
WWW Promptingguide Ai Techniques Rag
No ratings yet
WWW Promptingguide Ai Techniques Rag
4 pages
R22-B Tech CSE (DS)
No ratings yet
R22-B Tech CSE (DS)
10 pages
Difference Equations
No ratings yet
Difference Equations
8 pages
Data Mapping Tools and Techniques
No ratings yet
Data Mapping Tools and Techniques
3 pages
ECE Control Systems Q&A
No ratings yet
ECE Control Systems Q&A
42 pages
Prolog Programming and AI Concepts
No ratings yet
Prolog Programming and AI Concepts
4 pages
aDL-1-course Outline
No ratings yet
aDL-1-course Outline
17 pages
Regression Stat Assignment
No ratings yet
Regression Stat Assignment
7 pages
G11 2ND Sem Quarter1 Tos Statistics
No ratings yet
G11 2ND Sem Quarter1 Tos Statistics
2 pages
Bayesian Hierarchical Marketing Mix Model
No ratings yet
Bayesian Hierarchical Marketing Mix Model
16 pages
Trainity Project-6
No ratings yet
Trainity Project-6
12 pages
Lab Question Revised
No ratings yet
Lab Question Revised
4 pages
Image Steganography in Spatial Domain A Survey
No ratings yet
Image Steganography in Spatial Domain A Survey
21 pages
CIFAR-10 Image Classification Overview
No ratings yet
CIFAR-10 Image Classification Overview
18 pages
Cryptography Question Bank24 25docx
No ratings yet
Cryptography Question Bank24 25docx
3 pages
Solving ODE by Using Laplace Transformation
No ratings yet
Solving ODE by Using Laplace Transformation
8 pages
Understanding Errors in Numerical Analysis
No ratings yet
Understanding Errors in Numerical Analysis
3 pages
Tabular CUSUM Control Chart Overview
No ratings yet
Tabular CUSUM Control Chart Overview
22 pages
CAST-128 and RC4/RC5 Algorithms Explained
100% (1)
CAST-128 and RC4/RC5 Algorithms Explained
14 pages
Technical Note 30
No ratings yet
Technical Note 30
2 pages
AI Machine Learning Lecture Notes
No ratings yet
AI Machine Learning Lecture Notes
118 pages
DFA Transition Function Explained
No ratings yet
DFA Transition Function Explained
27 pages
AI1001 Assignment 9
No ratings yet
AI1001 Assignment 9
2 pages
Cs502 Midterm Solved Mcqs by Junaid Malik
No ratings yet
Cs502 Midterm Solved Mcqs by Junaid Malik
69 pages
Discrete Source Coding Guide
No ratings yet
Discrete Source Coding Guide
21 pages
Notes Geodesy
No ratings yet
Notes Geodesy
5 pages
Informatics Olympiad
No ratings yet
Informatics Olympiad
2 pages
Advanced AI Topics and Applications
No ratings yet
Advanced AI Topics and Applications
98 pages

AI1001 Assignment 9

Uploaded by

AI1001 Assignment 9

Uploaded by

Assignment 9: Model Selections and Optimization

Under and Over fitting

You might also like