0% found this document useful (0 votes)

38 views5 pages

Data Science Algorithm Guide

Uploaded by

Mohit Vaidya

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

38 views5 pages

Data Science Algorithm Guide

Uploaded by

Mohit Vaidya

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

DWM Practical Endgame

1. Naive Bayes
1. Import statements

import pandas as pd
from sklearn.model_selection import train_test_split
from [Link] import LabelEncoder
from [Link] import confusion_matrix, accuracy_score
from sklearn.naive_bayes import GaussianNB

data = pd.read_csv('laptop_buying_data.csv')

2. remove class label from dataset and put it in 'y' array

X = [Link]('Purchase Intention',axis=1)
y = data['Purchase Intention']

3. encoding (श वाले कॉलम को अंक म लाना)

le = LabelEncoder()
X['Gender'] = le.fit_transform(X['Gender'])
X['Occupation'] = le.fit_transform(X['Occupation'])
X['Brand Preference'] = le.fit_transform(X['Brand Preference'])

4. Splitting

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.3, random_stat

e = 42)

5. call naive bayes (split data ko naive bayes me fit karke predicted 'y'
dhundna)

nb_model = GaussianNB()
nb_model.fit(X_train, y_train)
y_pred = nb_model.predict(X_test)
6. print accuracy and matrix

conf_matrix = confusion_matrix(y_test, y_pred)

accuracy = accuracy_score(y_test, y_pred)
print(conf_matrix)
print(accuraccy)

2. ID3/Gini
1. Import statements

import pandas as pd
from sklearn.model_selection import train_test_split
from [Link] import DecisionTreeClassifier
from [Link] import confusion_matrix, accuracy_score
import [Link] as plt
from sklearn import tree

data = pd.read_csv('laptop_buying_data.csv')

2. encoding + remove class label from dataset and put it in 'y' array

X = data[['Age', 'Income', 'Previous Purchases', 'Gender', 'Occupation', 'Brand Prefer

ence']]
X = pd.get_dummies(X)
y = data['Purchase Intention']

3. splitting

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=

42)

4. call ID3 (almost same as naive bayes)

criterion = 'gini' for GINI
id3_model = DecisionTreeClassifier(criterion='entropy', random_state=42)
id3_model.fit(X_train, y_train)
y_pred = id3_model.predict(X_test)

5. print accuracy and matrix

conf_matrix = confusion_matrix(y_test, y_pred)

accuracy = accuracy_score(y_test, y_pred)

print("Confusion Matrix:")
print(conf_matrix)
print(f'Accuracy: {accuracy:.2f}')

6. plotting

[Link](figsize=(20,10))
tree.plot_tree(id3_model, filled=True, feature_names=[Link], class_names=
['No Purchase', 'Purchase'])
[Link]()

3. K Means
1. Import statements

import pandas as pd
import [Link] as plt
from [Link] import KMeans

data = pd.read_csv('customer_clustering_data.csv')

2. add dataset to X (no encoding required)

X = data[['Annual Income (k$)', 'Spending Score (1-100)']]

3. Call KMeans

optimal_k = 4
kmeans = KMeans(n_clusters=optimal_k, random_state=42)
[Link](X)
data['Cluster'] = kmeans.labels_

4. Plot

[Link](figsize=(10, 5))
[Link](data['Annual Income (k$)'], data['Spending Score (1-
100)'], c=data['Cluster'], cmap='viridis', s=50)
centers = kmeans.cluster_centers_
[Link](centers[:, 0], centers[:, 1], c='red', s=200, alpha=0.75, marker='X')
[Link]('Annual Income (k$)')
[Link]('Spending Score (1-100)')
[Link]()
[Link]()

5. Elbow method to find optimal_k (optional, mai toh chhod raha, seedha
4 assume)

inertia = []
k_values = range(1, 11)

for k in k_values:
kmeans = KMeans(n_clusters=k, random_state=42)
[Link](X)
[Link](kmeans.inertia_)

[Link](figsize=(10, 5))
[Link](k_values, inertia, marker='o')
[Link]('Number of clusters (k)')
[Link]('Inertia')
[Link](k_values)
[Link]()
[Link]()

Flow
1. Naive Bayes

import > drop_class_label > encoding > splitting > call_NaiveBayes > print

2. ID3

import > drop_class_label + encoding > splitting > call_NaiveBayes > print >
plot

3. K Means

import > add to X > find_optimal_K (optional) > call_KMeans > Plot

ML External Xerox
No ratings yet
ML External Xerox
1 page
Python ML Algorithms Guide
No ratings yet
Python ML Algorithms Guide
7 pages
Aml Lab
No ratings yet
Aml Lab
6 pages
ML Assignment 1 - Nageswar
No ratings yet
ML Assignment 1 - Nageswar
7 pages
Artificial Intelligence Advance Practical
No ratings yet
Artificial Intelligence Advance Practical
12 pages
Case Study - Classifier
No ratings yet
Case Study - Classifier
5 pages
S6 - Data Mining Lab Experiments (Except 1)
No ratings yet
S6 - Data Mining Lab Experiments (Except 1)
6 pages
Machine Learning Evaluation Guide
100% (1)
Machine Learning Evaluation Guide
504 pages
Naive Bayes Model With Python 1684166563
No ratings yet
Naive Bayes Model With Python 1684166563
9 pages
Prathamesh KRAI
No ratings yet
Prathamesh KRAI
38 pages
Machine - Learning - Assignment - 3
No ratings yet
Machine - Learning - Assignment - 3
5 pages
Exp 3
No ratings yet
Exp 3
5 pages
Machine Learning
No ratings yet
Machine Learning
8 pages
Data Science
No ratings yet
Data Science
8 pages
Slip
No ratings yet
Slip
5 pages
KNN - Predictive Analysis
No ratings yet
KNN - Predictive Analysis
6 pages
Support Vector Machine For Classification: Name: Saurav Doke Roll No: A-41 PRN: 2264191242040
No ratings yet
Support Vector Machine For Classification: Name: Saurav Doke Roll No: A-41 PRN: 2264191242040
3 pages
ML Lab-1
No ratings yet
ML Lab-1
32 pages
Shobit Sharma (2124399) ML Lab File PDF
No ratings yet
Shobit Sharma (2124399) ML Lab File PDF
19 pages
DSBDA Practicals
No ratings yet
DSBDA Practicals
16 pages
Lab Program (SVM From Scratch)
No ratings yet
Lab Program (SVM From Scratch)
2 pages
Machine Learning Da Ii Name: Mehakmeet Singh Regno: 16bce0376 Q6.)
No ratings yet
Machine Learning Da Ii Name: Mehakmeet Singh Regno: 16bce0376 Q6.)
48 pages
ML W8 Merged
No ratings yet
ML W8 Merged
27 pages
Machine Learning Concepts and Techniques
No ratings yet
Machine Learning Concepts and Techniques
13 pages
ML Batch
No ratings yet
ML Batch
36 pages
ML Lab
No ratings yet
ML Lab
10 pages
AI Note
No ratings yet
AI Note
5 pages
Machine Learning Classification Bootcamp
No ratings yet
Machine Learning Classification Bootcamp
7 pages
Ai Advanced - Unit - 3
No ratings yet
Ai Advanced - Unit - 3
4 pages
Here's An Visualization of The K-Nearest Neighbors Algorithm
No ratings yet
Here's An Visualization of The K-Nearest Neighbors Algorithm
5 pages
Machine Learning Lab Assignments
100% (2)
Machine Learning Lab Assignments
23 pages
Classification Review
No ratings yet
Classification Review
8 pages
Machine Learning Cheat Sheet
No ratings yet
Machine Learning Cheat Sheet
15 pages
ML Lab
No ratings yet
ML Lab
20 pages
SVM Implementation
No ratings yet
SVM Implementation
8 pages
Data Mining Practicals
No ratings yet
Data Mining Practicals
22 pages
Churn Prediction Model Evaluation
No ratings yet
Churn Prediction Model Evaluation
2 pages
ML P-6 - 024
No ratings yet
ML P-6 - 024
22 pages
ML Exp5 C36
No ratings yet
ML Exp5 C36
18 pages
Session 15
No ratings yet
Session 15
77 pages
CH 7
No ratings yet
CH 7
33 pages
05 E RandomForest LoanData
No ratings yet
05 E RandomForest LoanData
8 pages
Prakhar - Week 5
No ratings yet
Prakhar - Week 5
8 pages
Lecture1 MCQ Guide
No ratings yet
Lecture1 MCQ Guide
4 pages
Easy Pract ML
No ratings yet
Easy Pract ML
7 pages
Machine Learning II
No ratings yet
Machine Learning II
61 pages
ML Complete Notes Hridoy
No ratings yet
ML Complete Notes Hridoy
5 pages
Big Mart Sales Prediction Using ML
No ratings yet
Big Mart Sales Prediction Using ML
18 pages
BigData Week13
No ratings yet
BigData Week13
62 pages
Practical Machine Learning Code Examples
No ratings yet
Practical Machine Learning Code Examples
33 pages
Unit2 ML Programs
No ratings yet
Unit2 ML Programs
7 pages
Iris Dataset EDA & ML Techniques
100% (2)
Iris Dataset EDA & ML Techniques
24 pages
5 Markd
No ratings yet
5 Markd
24 pages
22MCA1008 - Varun ML LAB ASSIGNMENTS
100% (1)
22MCA1008 - Varun ML LAB ASSIGNMENTS
41 pages
Imbalanced Dataset Customer Churn
No ratings yet
Imbalanced Dataset Customer Churn
9 pages
CH 5
No ratings yet
CH 5
19 pages
B24 ML Exp-3
No ratings yet
B24 ML Exp-3
10 pages
MLT Experiment 3
No ratings yet
MLT Experiment 3
3 pages
MLfull
No ratings yet
MLfull
29 pages
Dmi Unit 5
No ratings yet
Dmi Unit 5
12 pages
Cluster Analysis and K-Means Guide
No ratings yet
Cluster Analysis and K-Means Guide
20 pages
Mba ZG536 Course Handout
No ratings yet
Mba ZG536 Course Handout
7 pages
Survival 2
No ratings yet
Survival 2
17 pages
Families of Children With Down Syndrome: Responding To "A Change in Plans" With Resilience
No ratings yet
Families of Children With Down Syndrome: Responding To "A Change in Plans" With Resilience
14 pages
The Role of The Boarding School System On Leadership Character Building and 21st
No ratings yet
The Role of The Boarding School System On Leadership Character Building and 21st
17 pages
Variance
No ratings yet
Variance
3 pages
Lecture 8: Heteroskedasticity: Causes Consequences Detection Fixes
No ratings yet
Lecture 8: Heteroskedasticity: Causes Consequences Detection Fixes
46 pages
Scatterplots PPT 1
100% (1)
Scatterplots PPT 1
17 pages
Statistics Cheat Sheet
100% (3)
Statistics Cheat Sheet
23 pages
PowerBI Interview Questions and Answers
100% (1)
PowerBI Interview Questions and Answers
8 pages
RegTech in Public and Private Sectors: The Nexus
No ratings yet
RegTech in Public and Private Sectors: The Nexus
39 pages
Unit 3 Question Bank
No ratings yet
Unit 3 Question Bank
8 pages
ANOVA Analysis for Car Safety Study
100% (1)
ANOVA Analysis for Car Safety Study
4 pages
Data Analytics Course
No ratings yet
Data Analytics Course
19 pages
AI Algorithm - Detect Glasses
No ratings yet
AI Algorithm - Detect Glasses
41 pages
SAT Math: Scatterplots & Models
No ratings yet
SAT Math: Scatterplots & Models
55 pages
1 de La Cruz Et Al (Done)
No ratings yet
1 de La Cruz Et Al (Done)
70 pages
Analisis Pengaruh Produk, Merek, Harga, Dan Promosi Terhadap Keputusan Pembelian Sepeda Motor Honda Beat
No ratings yet
Analisis Pengaruh Produk, Merek, Harga, Dan Promosi Terhadap Keputusan Pembelian Sepeda Motor Honda Beat
26 pages
Dummy Variables in Regression Analysis
100% (1)
Dummy Variables in Regression Analysis
31 pages
Diva
No ratings yet
Diva
11 pages
Lesson 13 Activity 16 BUTALIDQUEENIE
No ratings yet
Lesson 13 Activity 16 BUTALIDQUEENIE
4 pages
Implementation of Cooperative Learning Model Type Concept Sentence With Media Card Word To Improve Narrative Writing Skills Student Class VI SDN Kalisari I/242 Surabaya
No ratings yet
Implementation of Cooperative Learning Model Type Concept Sentence With Media Card Word To Improve Narrative Writing Skills Student Class VI SDN Kalisari I/242 Surabaya
6 pages
Postgraduate PG - Mba - Semester 3 - 2022 - November - Advanced Statistical Method Using R Pattern 2019
No ratings yet
Postgraduate PG - Mba - Semester 3 - 2022 - November - Advanced Statistical Method Using R Pattern 2019
2 pages
Data Mining Homework Assignment Guide
No ratings yet
Data Mining Homework Assignment Guide
3 pages
Novel Yne
No ratings yet
Novel Yne
3 pages
PVQ40 Scoring and Analysis Guide
No ratings yet
PVQ40 Scoring and Analysis Guide
4 pages
Profitability Matrix of Standalone Health Insurance Companies in India
No ratings yet
Profitability Matrix of Standalone Health Insurance Companies in India
9 pages
Algebra I Honors
No ratings yet
Algebra I Honors
47 pages
Jair A. Serrano: Psychometrician CV
No ratings yet
Jair A. Serrano: Psychometrician CV
1 page

Data Science Algorithm Guide

Uploaded by

Data Science Algorithm Guide

Uploaded by

DWM Practical Endgame

2. remove class label from dataset and put it in 'y' array

3. encoding (श वाले कॉलम को अंक म लाना)

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.3, random_stat

conf_matrix = confusion_matrix(y_test, y_pred)

X = data[['Age', 'Income', 'Previous Purchases', 'Gender', 'Occupation', 'Brand Prefer

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=

4. call ID3 (almost same as naive bayes)

5. print accuracy and matrix

conf_matrix = confusion_matrix(y_test, y_pred)

2. add dataset to X (no encoding required)

X = data[['Annual Income (k$)', 'Spending Score (1-100)']]

You might also like