0% found this document useful (0 votes)

51 views

Project 3 - Diabetes Prediction.ipynb - Colab

Uploaded by

anish.sarawgi5

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

51 views

Project 3 - Diabetes Prediction.ipynb - Colab

Uploaded by

anish.sarawgi5

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

11/28/24, 10:18 PM Project 3 - Diabetes Prediction.

ipynb - Colab

Importing the Dependencies

import numpy as np
import pandas as pd
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn import svm
from sklearn.metrics import accuracy_score

Data Collection and Analysis

PIMA Diabetes Dataset

# loading the diabetes dataset to a pandas DataFrame

diabetes_dataset = pd.read_csv('/content/diabetes.csv')

pd.read_csv?

# printing the first 5 rows of the dataset

diabetes_dataset.head()

Pregnancies Glucose BloodPressure SkinThickness Insulin BMI DiabetesPedigreeFunction Age Outcome

0 6 148 72 35 0 33.6 0.627 50 1

1 1 85 66 29 0 26.6 0.351 31 0

2 8 183 64 0 0 23.3 0.672 32 1

3 1 89 66 23 94 28.1 0.167 21 0

4 0 137 40 35 168 43.1 2.288 33 1

# number of rows and Columns in this dataset

diabetes_dataset.shape

(768, 9)

# getting the statistical measures of the data

diabetes_dataset.describe()

Pregnancies Glucose BloodPressure SkinThickness Insulin BMI DiabetesPedigreeFunction Age Outcome

count 768.000000 768.000000 768.000000 768.000000 768.000000 768.000000 768.000000 768.000000 768.000000

mean 3.845052 120.894531 69.105469 20.536458 79.799479 31.992578 0.471876 33.240885 0.348958

std 3.369578 31.972618 19.355807 15.952218 115.244002 7.884160 0.331329 11.760232 0.476951

min 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.078000 21.000000 0.000000

25% 1.000000 99.000000 62.000000 0.000000 0.000000 27.300000 0.243750 24.000000 0.000000

50% 3.000000 117.000000 72.000000 23.000000 30.500000 32.000000 0.372500 29.000000 0.000000

75% 6.000000 140.250000 80.000000 32.000000 127.250000 36.600000 0.626250 41.000000 1.000000

max 17.000000 199.000000 122.000000 99.000000 846.000000 67.100000 2.420000 81.000000 1.000000

diabetes_dataset['Outcome'].value_counts()

0 500
1 268
Name: Outcome, dtype: int64

0 --> Non-Diabetic

1 --> Diabetic

diabetes_dataset.groupby('Outcome').mean()

https://colab.research.google.com/drive/1oxnhMTlomJ4HVhPuowpPFyMt1mwuOuQo?usp=sharing#printMode=true 1/4
11/28/24, 10:18 PM Project 3 - Diabetes Prediction.ipynb - Colab

Pregnancies Glucose BloodPressure SkinThickness Insulin BMI DiabetesPedigreeFunction Age

Outcome

0 3.298000 109.980000 68.184000 19.664000 68.792000 30.304200 0.429734 31.190000

1 4.865672 141.257463 70.824627 22.164179 100.335821 35.142537 0.550500 37.067164

# separating the data and labels

X = diabetes_dataset.drop(columns = 'Outcome', axis=1)
Y = diabetes_dataset['Outcome']

print(X)

Pregnancies Glucose BloodPressure ... BMI DiabetesPedigreeFunction Age

0 6 148 72 ... 33.6 0.627 50
1 1 85 66 ... 26.6 0.351 31
2 8 183 64 ... 23.3 0.672 32
3 1 89 66 ... 28.1 0.167 21
4 0 137 40 ... 43.1 2.288 33
.. ... ... ... ... ... ... ...
763 10 101 76 ... 32.9 0.171 63
764 2 122 70 ... 36.8 0.340 27
765 5 121 72 ... 26.2 0.245 30
766 1 126 60 ... 30.1 0.349 47
767 1 93 70 ... 30.4 0.315 23

[768 rows x 8 columns]

print(Y)

0 1
1 0
2 1
3 0
4 1
..
763 0
764 0
765 0
766 1
767 0
Name: Outcome, Length: 768, dtype: int64

Data Standardization

scaler = StandardScaler()

scaler.fit(X)

StandardScaler(copy=True, with_mean=True, with_std=True)

standardized_data = scaler.transform(X)

print(standardized_data)

[[ 0.63994726 0.84832379 0.14964075 ... 0.20401277 0.46849198

1.4259954 ]
[-0.84488505 -1.12339636 -0.16054575 ... -0.68442195 -0.36506078
-0.19067191]
[ 1.23388019 1.94372388 -0.26394125 ... -1.10325546 0.60439732
-0.10558415]
...
[ 0.3429808 0.00330087 0.14964075 ... -0.73518964 -0.68519336
-0.27575966]
[-0.84488505 0.1597866 -0.47073225 ... -0.24020459 -0.37110101
1.17073215]
[-0.84488505 -0.8730192 0.04624525 ... -0.20212881 -0.47378505
-0.87137393]]

X = standardized_data
Y = diabetes_dataset['Outcome']

print(X)
print(Y)

[[ 0.63994726 0.84832379 0.14964075 ... 0.20401277 0.46849198

1.4259954 ]

https://colab.research.google.com/drive/1oxnhMTlomJ4HVhPuowpPFyMt1mwuOuQo?usp=sharing#printMode=true 2/4
11/28/24, 10:18 PM Project 3 - Diabetes Prediction.ipynb - Colab
[-0.84488505 -1.12339636 -0.16054575 ... -0.68442195 -0.36506078
-0.19067191]
[ 1.23388019 1.94372388 -0.26394125 ... -1.10325546 0.60439732
-0.10558415]
...
[ 0.3429808 0.00330087 0.14964075 ... -0.73518964 -0.68519336
-0.27575966]
[-0.84488505 0.1597866 -0.47073225 ... -0.24020459 -0.37110101
1.17073215]
[-0.84488505 -0.8730192 0.04624525 ... -0.20212881 -0.47378505
-0.87137393]]
0 1
1 0
2 1
3 0
4 1
..
763 0
764 0
765 0
766 1
767 0
Name: Outcome, Length: 768, dtype: int64

Train Test Split

X_train, X_test, Y_train, Y_test = train_test_split(X,Y, test_size = 0.2, stratify=Y, random_state=2)

print(X.shape, X_train.shape, X_test.shape)

(768, 8) (614, 8) (154, 8)

Training the Model

classifier = svm.SVC(kernel='linear')

#training the support vector Machine Classifier

classifier.fit(X_train, Y_train)

SVC(C=1.0, break_ties=False, cache_size=200, class_weight=None, coef0=0.0,

decision_function_shape='ovr', degree=3, gamma='scale', kernel='linear',
max_iter=-1, probability=False, random_state=None, shrinking=True,
tol=0.001, verbose=False)

Model Evaluation

Accuracy Score

# accuracy score on the training data

X_train_prediction = classifier.predict(X_train)
training_data_accuracy = accuracy_score(X_train_prediction, Y_train)

print('Accuracy score of the training data : ', training_data_accuracy)

Accuracy score of the training data : 0.7866449511400652

# accuracy score on the test data

X_test_prediction = classifier.predict(X_test)
test_data_accuracy = accuracy_score(X_test_prediction, Y_test)

print('Accuracy score of the test data : ', test_data_accuracy)

Accuracy score of the test data : 0.7727272727272727

Making a Predictive System

input_data = (5,166,72,19,175,25.8,0.587,51)

# changing the input_data to numpy array

input_data_as_numpy_array = np.asarray(input_data)

# reshape the array as we are predicting for one instance

https://colab.research.google.com/drive/1oxnhMTlomJ4HVhPuowpPFyMt1mwuOuQo?usp=sharing#printMode=true 3/4
11/28/24, 10:18 PM Project 3 - Diabetes Prediction.ipynb - Colab
input_data_reshaped = input_data_as_numpy_array.reshape(1,-1)

# standardize the input data

std_data = scaler.transform(input_data_reshaped)
print(std_data)

prediction = classifier.predict(std_data)
print(prediction)

if (prediction[0] == 0):
print('The person is not diabetic')
else:
print('The person is diabetic')

[[ 0.3429808 1.41167241 0.14964075 -0.09637905 0.82661621 -0.78595734

0.34768723 1.51108316]]
[1]
The person is diabetic

Start coding or generate with AI.

https://colab.research.google.com/drive/1oxnhMTlomJ4HVhPuowpPFyMt1mwuOuQo?usp=sharing#printMode=true 4/4

Step-By-Step-Diabetes-Classification-Knn-Detailed-Copy1 - Jupyter Notebook
No ratings yet
Step-By-Step-Diabetes-Classification-Knn-Detailed-Copy1 - Jupyter Notebook
12 pages
Pima Indian Diabetes Questions
No ratings yet
Pima Indian Diabetes Questions
6 pages
Diabetes
No ratings yet
Diabetes
7 pages
SPPUML5
No ratings yet
SPPUML5
4 pages
lab_8__(6)عفان عبدالله احمد_التكليف_
No ratings yet
lab_8__(6)عفان عبدالله احمد_التكليف_
18 pages
Data Science Practical 9
No ratings yet
Data Science Practical 9
6 pages
vertopal.com_python2025
No ratings yet
vertopal.com_python2025
25 pages
Diabetes - Prediction - Project - Ipynb - Colab
No ratings yet
Diabetes - Prediction - Project - Ipynb - Colab
11 pages
Diabetes Diagrama de Arbol
No ratings yet
Diabetes Diagrama de Arbol
4 pages
Diabetes Diagrama de Arbol
No ratings yet
Diabetes Diagrama de Arbol
4 pages
KNN - Jupyter Notebook (1)
No ratings yet
KNN - Jupyter Notebook (1)
7 pages
Diabetes Prediction System
No ratings yet
Diabetes Prediction System
4 pages
linear_merged_pagenumber
No ratings yet
linear_merged_pagenumber
48 pages
Day93 94 Diabetes Prediction Model
No ratings yet
Day93 94 Diabetes Prediction Model
27 pages
Cia 2 ML 2348352
No ratings yet
Cia 2 ML 2348352
6 pages
Clase-02-ML - Colab
No ratings yet
Clase-02-ML - Colab
5 pages
Logidtic_Regression_ASSIGNMENT
No ratings yet
Logidtic_Regression_ASSIGNMENT
13 pages
Diabetes Prediction
No ratings yet
Diabetes Prediction
1 page
DAL Experiment Outputs 6to10
No ratings yet
DAL Experiment Outputs 6to10
16 pages
Diabetes Prediction - Logistic Regression - Jupyter Notebook
No ratings yet
Diabetes Prediction - Logistic Regression - Jupyter Notebook
4 pages
Ml4.ipynb - Colab
No ratings yet
Ml4.ipynb - Colab
3 pages
Diabetes Prediction Using Logistic Regression - Untitled - Ipynb at Main Prajwal10031999 - Diabetes Prediction Using Logistic Regression GitHub
No ratings yet
Diabetes Prediction Using Logistic Regression - Untitled - Ipynb at Main Prajwal10031999 - Diabetes Prediction Using Logistic Regression GitHub
8 pages
ex3TP1
No ratings yet
ex3TP1
17 pages
ML Practical 3D
No ratings yet
ML Practical 3D
4 pages
Diabetis Project
No ratings yet
Diabetis Project
7 pages
Diabetes EDA and Kears Modeling
No ratings yet
Diabetes EDA and Kears Modeling
26 pages
Loading The Dataset: 'Diabetes - CSV'
No ratings yet
Loading The Dataset: 'Diabetes - CSV'
4 pages
Assignment 4
No ratings yet
Assignment 4
2 pages
Mean Vector and Correlation Matrix in R - Jupyter Notebook
No ratings yet
Mean Vector and Correlation Matrix in R - Jupyter Notebook
7 pages
Diabetes and Glucose Correlation - IBM Machine Learning Training Project
No ratings yet
Diabetes and Glucose Correlation - IBM Machine Learning Training Project
10 pages
Capstone Project 2
No ratings yet
Capstone Project 2
15 pages
Diabetic Prediction Using LogicalRegression
No ratings yet
Diabetic Prediction Using LogicalRegression
9 pages
Computation of Multipliers: Specify The Survival Column, L (X), and The Cost of Care at Each Age
No ratings yet
Computation of Multipliers: Specify The Survival Column, L (X), and The Cost of Care at Each Age
7 pages
Age Outlier BMI Outlier Glucose Outlier Insulin Outlier Homa Outlier
No ratings yet
Age Outlier BMI Outlier Glucose Outlier Insulin Outlier Homa Outlier
5 pages
labpg3.ipynb - Colab
No ratings yet
labpg3.ipynb - Colab
2 pages
3
No ratings yet
3
5 pages
ABAQU Sinputs
No ratings yet
ABAQU Sinputs
25 pages
BHMC17 P5.ipynb - Colaboratory
No ratings yet
BHMC17 P5.ipynb - Colaboratory
4 pages
Identifikasi Pemodelan Matematis Robot Wall Following
No ratings yet
Identifikasi Pemodelan Matematis Robot Wall Following
9 pages
Formulas 54
No ratings yet
Formulas 54
1 page
turing-data-analysis
No ratings yet
turing-data-analysis
30 pages
Untitled15.ipynb - Colaboratory
No ratings yet
Untitled15.ipynb - Colaboratory
1 page
Plot
No ratings yet
Plot
4 pages
Univariate and Multivariate Analysis - Jupyter Notebook
No ratings yet
Univariate and Multivariate Analysis - Jupyter Notebook
5 pages
Covid-19 Prediction - Jupyter Notebook
No ratings yet
Covid-19 Prediction - Jupyter Notebook
6 pages
PreK Sliding Scale FY 2022-23
No ratings yet
PreK Sliding Scale FY 2022-23
1 page
To Extract Features From Given Data Set and Establish Training Data
No ratings yet
To Extract Features From Given Data Set and Establish Training Data
2 pages
Paquibot_Lecture 8
No ratings yet
Paquibot_Lecture 8
8 pages
SVM - RF - Diabetes - CSV - 26 - 6 - 2023.ipynb - Colaboratory
No ratings yet
SVM - RF - Diabetes - CSV - 26 - 6 - 2023.ipynb - Colaboratory
8 pages
Wind Tunnel Experiment data (4)
No ratings yet
Wind Tunnel Experiment data (4)
5 pages
# Diabetes: Pandas PD Numpy NP Seaborn Sns
No ratings yet
# Diabetes: Pandas PD Numpy NP Seaborn Sns
4 pages
N (X, Average, Stdev)
No ratings yet
N (X, Average, Stdev)
8 pages
Fizika 1
No ratings yet
Fizika 1
3 pages
Anexo #01 Cálculo de Caída de Tensión Circuitos en Media Tensión
No ratings yet
Anexo #01 Cálculo de Caída de Tensión Circuitos en Media Tensión
69 pages
Daftar Pustaka: Economics Eleventh Edition. United States: Pearson Education
No ratings yet
Daftar Pustaka: Economics Eleventh Edition. United States: Pearson Education
4 pages
Aula 2 Mrp250
No ratings yet
Aula 2 Mrp250
123 pages
Aasia Ce-002 2324 Dynamics Assigment No 04
No ratings yet
Aasia Ce-002 2324 Dynamics Assigment No 04
11 pages
Ngeres Part 01
No ratings yet
Ngeres Part 01
6 pages
healthcare-project-simplilearn- Week1
No ratings yet
healthcare-project-simplilearn- Week1
6 pages
A List of Factorial Math Constants
From Everand
A List of Factorial Math Constants
Archive Classics
No ratings yet
Recherche Opérationnelle Et Aide À La Décision
100% (4)
Recherche Opérationnelle Et Aide À La Décision
131 pages
S.no Particular Super Value BSNL CUL Plan 129 1 Monthly Charge 2 Free Calls
No ratings yet
S.no Particular Super Value BSNL CUL Plan 129 1 Monthly Charge 2 Free Calls
12 pages
ADBMS Lab - Practical No.4 - Praveen Yadav - Roll No.62
No ratings yet
ADBMS Lab - Practical No.4 - Praveen Yadav - Roll No.62
9 pages
SimulationX Industry Solution Sheet Mining Technology
No ratings yet
SimulationX Industry Solution Sheet Mining Technology
2 pages
Organizational Change Management S4 - Whitepaper
No ratings yet
Organizational Change Management S4 - Whitepaper
17 pages
CE-1 Civil Engineering Orientation
No ratings yet
CE-1 Civil Engineering Orientation
18 pages
New Price List of 50-125CC ATV-011 012A 019B 019C 034 039 045-19 9 (Version 2)
No ratings yet
New Price List of 50-125CC ATV-011 012A 019B 019C 034 039 045-19 9 (Version 2)
23 pages
206L Cro CH65
No ratings yet
206L Cro CH65
66 pages
Peer Review Worksheet
No ratings yet
Peer Review Worksheet
4 pages
Copia de Unit # 3 Tickets, Money, Passport!
No ratings yet
Copia de Unit # 3 Tickets, Money, Passport!
18 pages
ANSYS CD 2017 Structures III Explicit Dynamcis
No ratings yet
ANSYS CD 2017 Structures III Explicit Dynamcis
10 pages
Essay
No ratings yet
Essay
2 pages
Accepted Manuscript: 10.1016/j.ejor.2017.02.039
No ratings yet
Accepted Manuscript: 10.1016/j.ejor.2017.02.039
25 pages
Rest House
No ratings yet
Rest House
4 pages
InDesign Tutorial
100% (6)
InDesign Tutorial
22 pages
Leaving Earth - Rules
No ratings yet
Leaving Earth - Rules
60 pages
SHORING FOR DEPTH 4.2m
No ratings yet
SHORING FOR DEPTH 4.2m
6 pages
Agilent E5061B Network Analyzer Data Sheet
No ratings yet
Agilent E5061B Network Analyzer Data Sheet
28 pages
DH Joyous Choir Handout PDF
No ratings yet
DH Joyous Choir Handout PDF
1 page
ETOMan White Paper
No ratings yet
ETOMan White Paper
2 pages
2.block Diagrams and SFG L14
No ratings yet
2.block Diagrams and SFG L14
13 pages
Transient Thermal Conduction Example
No ratings yet
Transient Thermal Conduction Example
7 pages
Automobile Warehouse Resume - Ashish Gautam
No ratings yet
Automobile Warehouse Resume - Ashish Gautam
2 pages
Biological Classification
0% (1)
Biological Classification
9 pages
Jupiter in House 7
No ratings yet
Jupiter in House 7
3 pages
The Book of Batch Scripting From Fundamentals to Advanced Automation 1st / converted Edition Jack Mclarney pdf download
100% (1)
The Book of Batch Scripting From Fundamentals to Advanced Automation 1st / converted Edition Jack Mclarney pdf download
50 pages
GP33 Manual Clsi
100% (1)
GP33 Manual Clsi
3 pages
Jaspal Kaur Public School: PREBOARD 2012 - 2013
No ratings yet
Jaspal Kaur Public School: PREBOARD 2012 - 2013
7 pages
Gypsum Ceiling
No ratings yet
Gypsum Ceiling
1 page
List of Adjectives - Feelings and Emotions
No ratings yet
List of Adjectives - Feelings and Emotions
4 pages