0% found this document useful (0 votes)

11 views3 pages

3 Outliers Iqr

The document discusses outlier detection and removal using the Interquartile Range (IQR) method on a dataset of heights. It provides a step-by-step approach to calculate the IQR, identify outliers, and remove them from the dataset. Additionally, it includes an exercise for the reader to apply similar techniques on a different dataset containing heights and weights.

Uploaded by

kart238

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

11 views3 pages

3 Outliers Iqr

Uploaded by

kart238

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

3-outliers-iqr

August 13, 2024

Outlier Detection and Removal Using IQR

[3]: import pandas as pd
df = pd.read_csv("heights.csv")
df

[3]: name height

0 mohan 1.2
1 maria 2.3
2 sakib 4.9
3 tao 5.1
4 virat 5.2
5 khusbu 5.4
6 dmitry 5.5
7 selena 5.5
8 john 5.6
9 imran 5.6
10 jose 5.8
11 deepika 5.9
12 yoseph 6.0
13 binod 6.1
14 gulshan 6.2
15 johnson 6.5
16 donald 7.1
17 aamir 14.5
18 ken 23.2
19 Liu 40.2

[4]: df.describe()

[4]: height
count 20.000000
mean 8.390000
std 8.782812
min 1.200000
25% 5.350000
50% 5.700000
75% 6.275000

1
max 40.200000

Detect outliers using IQR

[5]: Q1 = df.height.quantile(0.25)
Q3 = df.height.quantile(0.75)
Q1, Q3

[5]: (5.3500000000000005, 6.275)

[6]: IQR = Q3 - Q1
IQR

[6]: 0.9249999999999998

[7]: lower_limit = Q1 - 1.5*IQR

upper_limit = Q3 + 1.5*IQR
lower_limit, upper_limit

[7]: (3.962500000000001, 7.6625)

Here are the outliers

[8]: df[(df.height<lower_limit)|(df.height>upper_limit)]

[8]: name height

0 mohan 1.2
1 maria 2.3
17 aamir 14.5
18 ken 23.2
19 Liu 40.2

Remove outliers
[9]: df_no_outlier = df[(df.height>lower_limit)&(df.height<upper_limit)]
df_no_outlier

[9]: name height

2 sakib 4.9
3 tao 5.1
4 virat 5.2
5 khusbu 5.4
6 dmitry 5.5
7 selena 5.5
8 john 5.6
9 imran 5.6
10 jose 5.8
11 deepika 5.9

2
12 yoseph 6.0
13 binod 6.1
14 gulshan 6.2
15 johnson 6.5
16 donald 7.1

Exercise
You are given height_weight.csv file which contains heights and weights of 1000 people. Dataset
is taken from here, https://www.kaggle.com/mustafaali96/weight-height
You need to do this,
(1) Load this csv in pandas dataframe and first plot histograms for height and weight parameters
(2) Using IQR detect weight outliers and print them
(3) Using IQR, detect height outliers and print them
Solution

Missing Values and Outliers in R-Software
No ratings yet
Missing Values and Outliers in R-Software
17 pages
Outlier Treatment - Jupyter Notebook
No ratings yet
Outlier Treatment - Jupyter Notebook
15 pages
Advanced Data Analysis Techniques 3
No ratings yet
Advanced Data Analysis Techniques 3
31 pages
Empirical Rule and Outliers 1721456291
No ratings yet
Empirical Rule and Outliers 1721456291
13 pages
Statistics Session - 9 - Boxplot - Outliers
No ratings yet
Statistics Session - 9 - Boxplot - Outliers
6 pages
Lec 7 Data Visualization Basic Statistics Updated 21102024 122008pm
No ratings yet
Lec 7 Data Visualization Basic Statistics Updated 21102024 122008pm
39 pages
Height Weight Outlier Analysis
No ratings yet
Height Weight Outlier Analysis
2 pages
M4. Outliers
No ratings yet
M4. Outliers
11 pages
2
No ratings yet
2
3 pages
Prog 1
No ratings yet
Prog 1
3 pages
Nikita Prasad - Outliers Basics
No ratings yet
Nikita Prasad - Outliers Basics
13 pages
Anomaly Detection
No ratings yet
Anomaly Detection
10 pages
17 dm2 Anomaly Detection 2022 23
No ratings yet
17 dm2 Anomaly Detection 2022 23
113 pages
Probability & Statistics - Workbook.solutions
No ratings yet
Probability & Statistics - Workbook.solutions
471 pages
Outlier Iqr Exercise
No ratings yet
Outlier Iqr Exercise
3 pages
ML Ex2
No ratings yet
ML Ex2
7 pages
Numericalquestionsonzscoreand IQ
No ratings yet
Numericalquestionsonzscoreand IQ
3 pages
Introduction To Outlier Analysis Complete
No ratings yet
Introduction To Outlier Analysis Complete
12 pages
Outlier
No ratings yet
Outlier
12 pages
WINSEM2024-25 CBS3006 ETH VL2024250505168 2025-01-09 Reference-Material-III
No ratings yet
WINSEM2024-25 CBS3006 ETH VL2024250505168 2025-01-09 Reference-Material-III
4 pages
Shubham Dadhich Box Plot-1
No ratings yet
Shubham Dadhich Box Plot-1
9 pages
Bio Statistics For Medical Students
No ratings yet
Bio Statistics For Medical Students
208 pages
Lecture 3
No ratings yet
Lecture 3
23 pages
Guide On Outlier Detection Methods
No ratings yet
Guide On Outlier Detection Methods
11 pages
ML LAB Manual-1
No ratings yet
ML LAB Manual-1
33 pages
Week1 Code Corrected
No ratings yet
Week1 Code Corrected
2 pages
Explanatory Data Analysis
100% (1)
Explanatory Data Analysis
28 pages
Outliers ML
No ratings yet
Outliers ML
14 pages
UL Coded Project Report - KC
No ratings yet
UL Coded Project Report - KC
30 pages
Probability & Statistics - Workbook
No ratings yet
Probability & Statistics - Workbook
163 pages
Ads 7
No ratings yet
Ads 7
6 pages
Outlier Detection - Weka - IQR
No ratings yet
Outlier Detection - Weka - IQR
7 pages
Outlier Treatment
No ratings yet
Outlier Treatment
16 pages
Handle Outliers PySpark
No ratings yet
Handle Outliers PySpark
1 page
Identifying and Handling Outliers in Pandas - A Step-By-Step Guide - by Arvid Eichner - Python in Plain English
No ratings yet
Identifying and Handling Outliers in Pandas - A Step-By-Step Guide - by Arvid Eichner - Python in Plain English
19 pages
3-Introduction To Data Cleaning Outlires
No ratings yet
3-Introduction To Data Cleaning Outlires
5 pages
5 Ways To Find Outliers in Your Data - Statistics by Jim
No ratings yet
5 Ways To Find Outliers in Your Data - Statistics by Jim
35 pages
4 - Outliers - +transformaations ML
No ratings yet
4 - Outliers - +transformaations ML
28 pages
Distribution Shapes
No ratings yet
Distribution Shapes
22 pages
ML 8 Program
No ratings yet
ML 8 Program
5 pages
Statistical Test Methods For Hypothesis Testing
No ratings yet
Statistical Test Methods For Hypothesis Testing
6 pages
Practicle6 (Code)
No ratings yet
Practicle6 (Code)
4 pages
Workbook - Hypothesis Testing - Solutions
No ratings yet
Workbook - Hypothesis Testing - Solutions
91 pages
Outliers Z-Score
No ratings yet
Outliers Z-Score
1 page
Finding Outliers 2 Wayes Z-Score and Interquortile Range
No ratings yet
Finding Outliers 2 Wayes Z-Score and Interquortile Range
1 page
Univariate Outlier Detection
No ratings yet
Univariate Outlier Detection
9 pages
Outlier Detection
No ratings yet
Outlier Detection
41 pages
Outlier Detection in Non-Gaussian Distributions Uitschieter Detectie in Niet-Gauss Verdelingen
No ratings yet
Outlier Detection in Non-Gaussian Distributions Uitschieter Detectie in Niet-Gauss Verdelingen
45 pages
Chapter 5
No ratings yet
Chapter 5
116 pages
Aqrm Lecture 6
No ratings yet
Aqrm Lecture 6
17 pages
SMDM Project Business Report
No ratings yet
SMDM Project Business Report
1 page
Handling Outliers
No ratings yet
Handling Outliers
6 pages
11 Different Ways For Outlier Detection in Python
No ratings yet
11 Different Ways For Outlier Detection in Python
11 pages
Handling Ouliers
No ratings yet
Handling Ouliers
5 pages
Central Tendecies Mean (20230527 - 085846)
No ratings yet
Central Tendecies Mean (20230527 - 085846)
9 pages
Python Seaborn Tutorial For Beginners v2
No ratings yet
Python Seaborn Tutorial For Beginners v2
40 pages
6.outlier Code - Jupyter Notebook
No ratings yet
6.outlier Code - Jupyter Notebook
5 pages
ISAT 600 Progress Report 3
No ratings yet
ISAT 600 Progress Report 3
4 pages
Identifying and Excluding Outliers The 130% IQR Rule: ST RD
No ratings yet
Identifying and Excluding Outliers The 130% IQR Rule: ST RD
3 pages
Assignment 2 Ds
No ratings yet
Assignment 2 Ds
8 pages
6735367a5d6e24a5f185bf9c 99512104437
No ratings yet
6735367a5d6e24a5f185bf9c 99512104437
2 pages
Notes PDF ML Day 17
No ratings yet
Notes PDF ML Day 17
9 pages
Outlier Detection and Removal
No ratings yet
Outlier Detection and Removal
2 pages
Adsl Exp 8 2024
No ratings yet
Adsl Exp 8 2024
10 pages
BAED STAT2112 Statistics and Probability Second Quarter Exam
No ratings yet
BAED STAT2112 Statistics and Probability Second Quarter Exam
51 pages
Visualization 2
No ratings yet
Visualization 2
1 page
Research Methodology Lab File
No ratings yet
Research Methodology Lab File
92 pages
Workbook - Hypothesis Testing
No ratings yet
Workbook - Hypothesis Testing
26 pages
09 Lineplot
No ratings yet
09 Lineplot
21 pages
01 Mean, Variance, and Standard Deviation
No ratings yet
01 Mean, Variance, and Standard Deviation
10 pages
LP2-partea2-Indian Liver Patient Dataset (ILPD)
No ratings yet
LP2-partea2-Indian Liver Patient Dataset (ILPD)
41 pages
Probability & Statistics - Final Exam - Solutions
No ratings yet
Probability & Statistics - Final Exam - Solutions
16 pages
Workbook - Discrete Random Variables
No ratings yet
Workbook - Discrete Random Variables
19 pages
10 Building Histograms From Data Sets
No ratings yet
10 Building Histograms From Data Sets
7 pages
Outlier Detection and Capping
No ratings yet
Outlier Detection and Capping
7 pages
(Ebooks PDF) Download (Ebook PDF) Statistical Techniques in Business and Economics 18th Edition Full Chapters
100% (5)
(Ebooks PDF) Download (Ebook PDF) Statistical Techniques in Business and Economics 18th Edition Full Chapters
41 pages
Brochure - Global Wi-Fi Market - Global Forecast To 2020
No ratings yet
Brochure - Global Wi-Fi Market - Global Forecast To 2020
24 pages
Workbook Regression
No ratings yet
Workbook Regression
18 pages
07 Relative Frequency Tables
No ratings yet
07 Relative Frequency Tables
6 pages
09 Histograms and Stem-And-leaf Plots
No ratings yet
09 Histograms and Stem-And-leaf Plots
6 pages
02 Frequency Histograms and Polygons, and Density Curves
No ratings yet
02 Frequency Histograms and Polygons, and Density Curves
6 pages
03 Symmetric and Skewed Distributions and Outliers
No ratings yet
03 Symmetric and Skewed Distributions and Outliers
6 pages
01 Measures of Central Tendency
No ratings yet
01 Measures of Central Tendency
6 pages
04 Box and Whisker Plots
No ratings yet
04 Box and Whisker Plots
6 pages
08 Joint Distributions
No ratings yet
08 Joint Distributions
6 pages
11 - Asterix and The Chieftains Shield (1968) (Digital-Empire) (WebP by Doc MaKS)
No ratings yet
11 - Asterix and The Chieftains Shield (1968) (Digital-Empire) (WebP by Doc MaKS)
54 pages
02 Measures of Spread
No ratings yet
02 Measures of Spread
6 pages
MMW Chapter 4 GH Annotated1
No ratings yet
MMW Chapter 4 GH Annotated1
33 pages
Pearson R Correlation
No ratings yet
Pearson R Correlation
2 pages
Chapter 7 3
No ratings yet
Chapter 7 3
30 pages
Probability & Statistics - Final Exam - Practice 1
No ratings yet
Probability & Statistics - Final Exam - Practice 1
9 pages
Probability & Statistics - Final Exam
No ratings yet
Probability & Statistics - Final Exam
9 pages
Car Insurance Insights Summary Presentation
No ratings yet
Car Insurance Insights Summary Presentation
10 pages
02 Significance Level and Type I and II Errors
No ratings yet
02 Significance Level and Type I and II Errors
8 pages
Contoh Soal2 Reliability
No ratings yet
Contoh Soal2 Reliability
25 pages
03 Coefficient of Determination and RMSE
No ratings yet
03 Coefficient of Determination and RMSE
7 pages
10 Hypothesis Testing For The Difference of Proportions
No ratings yet
10 Hypothesis Testing For The Difference of Proportions
9 pages
12 - Asterix at The Olympic Games (1968) (Digital-Empire) (WebP by Doc MaKS)
100% (1)
12 - Asterix at The Olympic Games (1968) (Digital-Empire) (WebP by Doc MaKS)
54 pages
A3 Aide Memoir FOV Configuration Pixel Densities
No ratings yet
A3 Aide Memoir FOV Configuration Pixel Densities
1 page
Session 17-20
No ratings yet
Session 17-20
16 pages
Chapter 4 Measure of Central Tendency
No ratings yet
Chapter 4 Measure of Central Tendency
29 pages
Probablistics Formulas
No ratings yet
Probablistics Formulas
8 pages
The Normal Distribution
No ratings yet
The Normal Distribution
23 pages
13 - Asterix and The Cauldron (1969) (Digital-Empire) (WebP by Doc MaKS)
100% (1)
13 - Asterix and The Cauldron (1969) (Digital-Empire) (WebP by Doc MaKS)
54 pages
Financial Maths Group Project: Navin Bafna Arvind Shah Abahan Banerjee Abhishek Chandra Abhishek Dhawan
No ratings yet
Financial Maths Group Project: Navin Bafna Arvind Shah Abahan Banerjee Abhishek Chandra Abhishek Dhawan
16 pages
Diago, Primel MS 102 Midterm M2 L1
No ratings yet
Diago, Primel MS 102 Midterm M2 L1
11 pages
IBA ASSIGNMENT p22251
No ratings yet
IBA ASSIGNMENT p22251
6 pages
18BCE10291 - Outliers Assignment
No ratings yet
18BCE10291 - Outliers Assignment
10 pages
Pearson's Correlation
No ratings yet
Pearson's Correlation
4 pages
ISB ITPM Assignment 7.2 Anmol Srivastava
No ratings yet
ISB ITPM Assignment 7.2 Anmol Srivastava
3 pages
Let's Apply
No ratings yet
Let's Apply
5 pages
Shoe Size (Responses)
No ratings yet
Shoe Size (Responses)
4 pages
Activity 4.3 Central Tendency and Variability Measures
0% (1)
Activity 4.3 Central Tendency and Variability Measures
2 pages
Module 7
No ratings yet
Module 7
5 pages
MATH 6200 2013T UGRD Data Analysis Midterm Exam - PDF 1
No ratings yet
MATH 6200 2013T UGRD Data Analysis Midterm Exam - PDF 1
10 pages
Boxplot Outlier
No ratings yet
Boxplot Outlier
3 pages
A1 Coac
No ratings yet
A1 Coac
6 pages
School of Engineering and Computer Science Independent University, Bangladesh Course No: MAT 211 Course Title: Probability and Statistics Autumn 2013
No ratings yet
School of Engineering and Computer Science Independent University, Bangladesh Course No: MAT 211 Course Title: Probability and Statistics Autumn 2013
4 pages
D3.js数据可视化实战手册: Chinese Edition
From Everand
D3.js数据可视化实战手册: Chinese Edition
Posts & Telecom Press
No ratings yet
Mastering Docker for Scalable Deployment: From Container Basics to Orchestrating Complex Work
From Everand
Mastering Docker for Scalable Deployment: From Container Basics to Orchestrating Complex Work
Kameron Hussain
No ratings yet

3 Outliers Iqr

Uploaded by

3 Outliers Iqr

Uploaded by

3-outliers-iqr

August 13, 2024

Outlier Detection and Removal Using IQR

[3]: name height

Detect outliers using IQR

[5]: (5.3500000000000005, 6.275)

[7]: lower_limit = Q1 - 1.5*IQR

[7]: (3.962500000000001, 7.6625)

Here are the outliers

[8]: name height

[9]: name height

You might also like