0% found this document useful (0 votes)

19 views3 pages

Data Analytics Unit4 Notes

The document outlines key concepts in data analytics, including the differences between supervised and unsupervised learning, segmentation techniques, decision trees, overfitting, and measures of forecast accuracy. It details various algorithms, applications, and evaluation methods relevant to these topics. Additionally, it covers STL decomposition for analyzing time series data.

Uploaded by

nagarajchintu1234

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

19 views3 pages

Data Analytics Unit4 Notes

Uploaded by

nagarajchintu1234

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Data Analytics - Unit 4 Notes

1. Supervised vs Unsupervised Learning (Tabular Format)

| Feature | Supervised Learning | Unsupervised Learning |

|-------------------------------|----------------------------------------------------------|----------------------------------------------------------|
| Definition | Learning with labeled data | Learning with unlabeled data |
| Input Data | Input has output labels | Input has no output labels |
| Goal | Predict output | Discover hidden patterns |
| Output Type | Predictive (classification/regression) | Descriptive (clusters/associations)
|
| Examples of Tasks | Classification, Regression | Clustering, Association
|
| Evaluation | Accuracy, RMSE, etc. | Silhouette score, manual interpretation
|
| Algorithms | Decision Trees, SVM, Linear Regression | K-Means, DBSCAN, PCA
|
| Use Cases | Email spam detection, loan approval | Customer segmentation, anomaly
detection |

2. Segmentation

Segmentation divides a large dataset into smaller, meaningful subgroups based on similar behavior or attributes.

Types: Demographic, Geographic, Behavioral, Psychographic

Techniques: K-Means, Hierarchical, DBSCAN

Applications: Marketing, Healthcare, Finance, E-commerce

Purpose: Discover patterns, target specific user groups, improve model performance.

3. Decision Trees

A tree-like structure used for classification or regression.

Types:
- Classification Tree: Categorical output
- Regression Tree: Numerical output

Process:
1. Select splitting attribute (e.g., Gini, Entropy)
2. Split data into subsets
3. Recur until leaf nodes are pure
Data Analytics - Unit 4 Notes

Overfitting: Deep trees that memorize training data

Pruning: Reduces tree size to prevent overfitting

Applications: Loan approval, diagnosis, HR attrition

4. Overfitting and Pruning

Overfitting: When model fits training data too well, including noise

Symptoms: High training accuracy, poor test accuracy

Pruning Types:
- Pre-pruning: Stop early (e.g., max depth, min samples)
- Post-pruning: Build full tree, then cut weak branches

Goal: Improve generalization, reduce complexity

5. Measures of Forecast Accuracy

Used to evaluate time series model performance:

- MAE = Mean Absolute Error

- MSE = Mean Squared Error
- RMSE = Root Mean Squared Error
- MAPE = Mean Absolute Percentage Error
- sMAPE = Symmetric MAPE

Applications: Retail demand, finance, weather forecasting

Lower values = Better accuracy

6. STL Decomposition

STL = Seasonal and Trend decomposition using Loess

Components:
- Trend: Long-term movement
- Seasonality: Repeated cycles
- Residual: Noise

Uses Loess smoothing for flexible decomposition

Data Analytics - Unit 4 Notes

Applications: Sales trends, stock prices, weather patterns

Helps clean and analyze time series data before forecasting.

Data Analytics Unit4 FullNotes
No ratings yet
Data Analytics Unit4 FullNotes
4 pages
3 Pred Analysis
No ratings yet
3 Pred Analysis
18 pages
MCC Mba ML and Ai May30 2024
No ratings yet
MCC Mba ML and Ai May30 2024
201 pages
Da Imp Qna Cleaned
No ratings yet
Da Imp Qna Cleaned
7 pages
Unit Iv Material 06032025 Object Segmentation
No ratings yet
Unit Iv Material 06032025 Object Segmentation
38 pages
ML - Machine Learning PDF
No ratings yet
ML - Machine Learning PDF
13 pages
Unit 4 Learning
No ratings yet
Unit 4 Learning
5 pages
Data Science in FInancial Services - 3
No ratings yet
Data Science in FInancial Services - 3
76 pages
2.0 Machine Learning Introduction
No ratings yet
2.0 Machine Learning Introduction
24 pages
DM Unit - 3
No ratings yet
DM Unit - 3
21 pages
Data Science Lecture: Classification & Regression
No ratings yet
Data Science Lecture: Classification & Regression
27 pages
Predictive Analytics & Data Mining
No ratings yet
Predictive Analytics & Data Mining
15 pages
Machine Learning Concept1
No ratings yet
Machine Learning Concept1
16 pages
Pattern Recognition Unit 2
No ratings yet
Pattern Recognition Unit 2
24 pages
Machine Learning Overview & Techniques
No ratings yet
Machine Learning Overview & Techniques
30 pages
Machine Learning
No ratings yet
Machine Learning
32 pages
R Machine Learning: Data Modeling Guide
No ratings yet
R Machine Learning: Data Modeling Guide
10 pages
Week - 03 Week04
No ratings yet
Week - 03 Week04
32 pages
Big Data
No ratings yet
Big Data
5 pages
ML Revision
No ratings yet
ML Revision
5 pages
Classification
No ratings yet
Classification
5 pages
Data Analytics Unit IV
No ratings yet
Data Analytics Unit IV
36 pages
Big Data Analytics Unit 4
No ratings yet
Big Data Analytics Unit 4
17 pages
Unit 4 DWDM
No ratings yet
Unit 4 DWDM
8 pages
Python 06 MachineLearning
No ratings yet
Python 06 MachineLearning
45 pages
Machine Learning AL-405 GS Answers
No ratings yet
Machine Learning AL-405 GS Answers
3 pages
Unit 3 Ds
No ratings yet
Unit 3 Ds
10 pages
Data Science Algorithms Comparison
No ratings yet
Data Science Algorithms Comparison
13 pages
Kavin
No ratings yet
Kavin
15 pages
Introduction To Data Mining
No ratings yet
Introduction To Data Mining
13 pages
Deployment: Cheat Sheet: Machine Learning With KNIME Analytics Platform
No ratings yet
Deployment: Cheat Sheet: Machine Learning With KNIME Analytics Platform
1 page
Lecture 1
No ratings yet
Lecture 1
62 pages
None
No ratings yet
None
16 pages
Machine Learning Notes ?
No ratings yet
Machine Learning Notes ?
14 pages
Big Data Analytics - Unit 3
No ratings yet
Big Data Analytics - Unit 3
55 pages
Pattern Summary Final
No ratings yet
Pattern Summary Final
28 pages
ChatGPT - Machine Learning Overview
No ratings yet
ChatGPT - Machine Learning Overview
34 pages
Final ML
No ratings yet
Final ML
2 pages
Predictive Unit 1
No ratings yet
Predictive Unit 1
22 pages
Lecture Notes 1 2 Intro Python
No ratings yet
Lecture Notes 1 2 Intro Python
13 pages
Unit-4 Pda
No ratings yet
Unit-4 Pda
111 pages
Marketing Analytics Week-8 LAQ
No ratings yet
Marketing Analytics Week-8 LAQ
4 pages
مشین سیکھنا
No ratings yet
مشین سیکھنا
5 pages
Introduction To Data Mining
No ratings yet
Introduction To Data Mining
9 pages
Beginner's Guide to Machine Learning
No ratings yet
Beginner's Guide to Machine Learning
37 pages
Machine Learning Demo Presentation
No ratings yet
Machine Learning Demo Presentation
26 pages
Unit 3
No ratings yet
Unit 3
28 pages
Supervised Learning in Healthcare Insights
No ratings yet
Supervised Learning in Healthcare Insights
6 pages
Machine Learning
No ratings yet
Machine Learning
42 pages
Machine Learning Algorithms Guide
No ratings yet
Machine Learning Algorithms Guide
3 pages
Regression vs Segmentation in Learning
No ratings yet
Regression vs Segmentation in Learning
13 pages
Machine Learning Techniques Explained
100% (1)
Machine Learning Techniques Explained
12 pages
1 - Supervised Learning & Its Types
No ratings yet
1 - Supervised Learning & Its Types
24 pages
CatBoost and XGBoost Overview
No ratings yet
CatBoost and XGBoost Overview
11 pages
AIML Solved Paper Nov-Dec 2024
No ratings yet
AIML Solved Paper Nov-Dec 2024
2 pages
Machine Learning: Supervised vs Unsupervised
No ratings yet
Machine Learning: Supervised vs Unsupervised
21 pages
Example of Customer Data For Data Science Problems
No ratings yet
Example of Customer Data For Data Science Problems
5 pages
Introduction to Predictive Analytics
No ratings yet
Introduction to Predictive Analytics
30 pages
Revised Standart Equations of Motions
No ratings yet
Revised Standart Equations of Motions
31 pages
Matlab Programming for Students
No ratings yet
Matlab Programming for Students
8 pages
Germany Opportunity Card Visa Guide
No ratings yet
Germany Opportunity Card Visa Guide
4 pages
SIB Debit Card Offer at Croma
No ratings yet
SIB Debit Card Offer at Croma
2 pages
Unitary Analysis, Synthesis, and Classification of Flow Meters 1st Edition Horia Mihai Moțit
No ratings yet
Unitary Analysis, Synthesis, and Classification of Flow Meters 1st Edition Horia Mihai Moțit
66 pages
AdmissionForm GIM
No ratings yet
AdmissionForm GIM
2 pages
The Power of Your Subconscious Mind اردو ترجمہ PDF - Google Search
100% (1)
The Power of Your Subconscious Mind اردو ترجمہ PDF - Google Search
1 page
International Institute For Special Education (IISE) : Presentation On Cost of Preference Shares
No ratings yet
International Institute For Special Education (IISE) : Presentation On Cost of Preference Shares
11 pages
Android Thread Debugging Info
No ratings yet
Android Thread Debugging Info
146 pages
Malpractice in Paulino Land Dispute
100% (2)
Malpractice in Paulino Land Dispute
2 pages
ScintCare CT 16 Service Manual Rev.D en
No ratings yet
ScintCare CT 16 Service Manual Rev.D en
214 pages
HKCareers - Introduction To Derivative Instruments
No ratings yet
HKCareers - Introduction To Derivative Instruments
39 pages
Synopsis On Online Shopping Website
No ratings yet
Synopsis On Online Shopping Website
82 pages
Https:/meta-Secure - com/TNDALU/PrintCollege Allotted Data - Aspx
No ratings yet
Https:/meta-Secure - com/TNDALU/PrintCollege Allotted Data - Aspx
2 pages
Technical Seminar Guidelines-2024-25
No ratings yet
Technical Seminar Guidelines-2024-25
4 pages
Digital Circuit Lab 1
No ratings yet
Digital Circuit Lab 1
4 pages
Contrail
No ratings yet
Contrail
44 pages
Advances - Deposits - and - Prepayments - Audit - Program - TOD
100% (1)
Advances - Deposits - and - Prepayments - Audit - Program - TOD
20 pages
Ceres Gardening Financial Analysis 2002-2006
No ratings yet
Ceres Gardening Financial Analysis 2002-2006
8 pages
Problem Set 5 (Chapter 7) Due: 04/02/2019
No ratings yet
Problem Set 5 (Chapter 7) Due: 04/02/2019
8 pages
Kenwood Kac 923
No ratings yet
Kenwood Kac 923
35 pages
Regression Analysis Using SPSS: DR Somesh K Sinha
100% (1)
Regression Analysis Using SPSS: DR Somesh K Sinha
17 pages
Power System Analysis - EE3501 - Hand Written College Notes - Unit 3 - Symmetrical Fault Analysis-2
No ratings yet
Power System Analysis - EE3501 - Hand Written College Notes - Unit 3 - Symmetrical Fault Analysis-2
27 pages
ME 213 Spring 2021 Mid Exam
No ratings yet
ME 213 Spring 2021 Mid Exam
3 pages
En US 8700000510 202103221038801 User Manual - File Longen US
No ratings yet
En US 8700000510 202103221038801 User Manual - File Longen US
16 pages
Gen Parental Consent Form
No ratings yet
Gen Parental Consent Form
3 pages
Document
No ratings yet
Document
3 pages
RTV160, RTV162 and RTV167 Electronic Grade Silicone Adhesive Sealants
No ratings yet
RTV160, RTV162 and RTV167 Electronic Grade Silicone Adhesive Sealants
4 pages
Phoresis Extended Eng Rel. 5
No ratings yet
Phoresis Extended Eng Rel. 5
24 pages
Fungsi Pengawasan DPRD Dalam Mewujudkan Tata Kelola Pemerintahan Yang Baik
No ratings yet
Fungsi Pengawasan DPRD Dalam Mewujudkan Tata Kelola Pemerintahan Yang Baik
10 pages

Data Analytics Unit4 Notes

Uploaded by

Data Analytics Unit4 Notes

Uploaded by

Data Analytics - Unit 4 Notes

1. Supervised vs Unsupervised Learning (Tabular Format)

| Feature | Supervised Learning | Unsupervised Learning |

Types: Demographic, Geographic, Behavioral, Psychographic

Techniques: K-Means, Hierarchical, DBSCAN

Applications: Marketing, Healthcare, Finance, E-commerce

A tree-like structure used for classification or regression.

Overfitting: Deep trees that memorize training data

Applications: Loan approval, diagnosis, HR attrition

4. Overfitting and Pruning

Symptoms: High training accuracy, poor test accuracy

Goal: Improve generalization, reduce complexity

5. Measures of Forecast Accuracy

Used to evaluate time series model performance:

- MAE = Mean Absolute Error

Applications: Retail demand, finance, weather forecasting

Lower values = Better accuracy

STL = Seasonal and Trend decomposition using Loess

Uses Loess smoothing for flexible decomposition

Applications: Sales trends, stock prices, weather patterns

Helps clean and analyze time series data before forecasting.

You might also like