0% found this document useful (0 votes)

24 views7 pages

Evaluate Machine Learning Models in Python

The document contains Python code for loading and processing a dataset related to RNA mutations and overall survival. It implements machine learning models, specifically Random Forest and Support Vector Classifier, to evaluate their performance using metrics such as F1 Score and Accuracy. The results are visualized using confusion matrices and bar plots for comparison of model performance.

Uploaded by

zakirhussain281999

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

24 views7 pages

Evaluate Machine Learning Models in Python

Uploaded by

zakirhussain281999

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Code:

import pandas as pd

import [Link] as plt

import seaborn as sns

from sklearn.model_selection import train_test_split

from [Link] import (

classification_report, confusion_matrix, roc_auc_score, accuracy_score, f1_score

from [Link] import LabelEncoder

from [Link] import RandomForestClassifier

from [Link] import SVC

# Load and process the dataset

metabric_df = pd.read_csv("./METABRIC_RNA_Mutation.csv")

metabric_df.shape

metabric_df.info(verbose=True)

metabric_df.sample(5)

metabric_df = metabric_df.set_index('patient_id')

df_expression = metabric_df.iloc[:, 30:519].join(metabric_df['overall_survival'], how='inner')

df_expression

# Dictionary to store F1 and accuracy scores of each model

metrics_summary = {"Model": [], "F1 Score": [], "Accuracy": []}

# Function to evaluate and display results

def evaluate_model(model, X_train, X_test, y_train, y_test, model_name):

[Link](X_train, y_train)

# Predictions and probabilities (if applicable)

y_pred = [Link](X_test)

y_proba = model.predict_proba(X_test)[:, 1] if hasattr(

model, 'predict_proba') else None

# Calculate metrics

f1 = f1_score(y_test, y_pred, average='weighted')

accuracy = accuracy_score(y_test, y_pred)

# Store the metrics

metrics_summary["Model"].append(model_name)

metrics_summary["F1 Score"].append(f1)

metrics_summary["Accuracy"].append(accuracy)

# Display classification metrics

print(f"\n=== {model_name} ===")

print("Classification Report:\n", classification_report(y_test, y_pred))

print(f"Accuracy: {accuracy:.4f}")

print(f"F1 Score: {f1:.4f}")

# Confusion Matrix Visualization

cm = confusion_matrix(y_test, y_pred)

[Link](figsize=(6, 4))

[Link](cm, annot=True, fmt='d', cmap='Blues', xticklabels=[

'Pred 0', 'Pred 1'], yticklabels=['True 0', 'True 1'])

[Link](f'Confusion Matrix - {model_name}')

[Link]('Predicted Label')

[Link]('True Label')

[Link]()

# AUC-ROC Score (if applicable)

if y_proba is not None:

print(f"AUC-ROC Score: {roc_auc_score(y_test, y_proba):.4f}")

# Main function to process the dataset and evaluate models

def main(df, target_column):

# Prepare the dataset

X = [Link](target_column, axis=1)

y = df[target_column]

# Handle categorical variables

X = pd.get_dummies(X, drop_first=True)

if [Link] == 'object':

y = LabelEncoder().fit_transform(y)

# Split the dataset

X_train, X_test, y_train, y_test = train_test_split(

X, y, test_size=0.3, random_state=42)

# Define classifiers to be evaluated

models = {

'Random Forest': RandomForestClassifier(),

'Support Vector Classifier': SVC(probability=True),

# Train and evaluate all models

for name, model in [Link]():

evaluate_model(model, X_train, X_test, y_train, y_test, name)

# Plot F1 Scores of all models

[Link](figsize=(10, 5))

[Link](x=metrics_summary["Model"],

y=metrics_summary["F1 Score"], palette='coolwarm')

[Link](rotation=45)

[Link]('F1 Scores of All Models')

[Link]('F1 Score')
[Link]()

# Plot Accuracy Scores of all models

[Link](figsize=(10, 5))

[Link](x=metrics_summary["Model"],

y=metrics_summary["Accuracy"], palette='coolwarm')

[Link](rotation=45)

[Link]('Accuracy Scores of All Models')

[Link]('Accuracy')

[Link]()

# Load your dataset and specify the target column

if __name__ == "__main__":

# Replace with your dataframe

df = df_expression # Example input dataframe

target_column = 'overall_survival' # Replace with the actual target column name

main(df, target_column)

Output:

Medical Data Analysis and Modeling
No ratings yet
Medical Data Analysis and Modeling
6 pages
Breast Cancer Classifier Comparison
No ratings yet
Breast Cancer Classifier Comparison
5 pages
Disease Prediction with Machine Learning
No ratings yet
Disease Prediction with Machine Learning
573 pages
Naïve Bayes Classifier Implementation
No ratings yet
Naïve Bayes Classifier Implementation
37 pages
ML PDF
No ratings yet
ML PDF
30 pages
Build Regression and Classification Models
No ratings yet
Build Regression and Classification Models
15 pages
Customer Churn Prediction Analysis
No ratings yet
Customer Churn Prediction Analysis
4 pages
Disease Classification Model Evaluation
No ratings yet
Disease Classification Model Evaluation
4 pages
Breast Cancer Classification with RF
No ratings yet
Breast Cancer Classification with RF
6 pages
Build Regression, Decision Trees, SVMs
No ratings yet
Build Regression, Decision Trees, SVMs
19 pages
Heart Disease Classification with ML
No ratings yet
Heart Disease Classification with ML
10 pages
Disease Prediction Using Symptoms Analysis
No ratings yet
Disease Prediction Using Symptoms Analysis
5 pages
Evaluación de Modelos de Aprendizaje Automático
No ratings yet
Evaluación de Modelos de Aprendizaje Automático
5 pages
Titanic Dataset ML Analysis
No ratings yet
Titanic Dataset ML Analysis
10 pages
Anomaly Detection with PCA and Random Forest
No ratings yet
Anomaly Detection with PCA and Random Forest
5 pages
K-Means Clustering on Breast Cancer Data
No ratings yet
K-Means Clustering on Breast Cancer Data
15 pages
Python Code for Healthcare ML Analysis
No ratings yet
Python Code for Healthcare ML Analysis
8 pages
Detect Fake Profiles with Random Forest
No ratings yet
Detect Fake Profiles with Random Forest
8 pages
Data Science Experiments with Python
No ratings yet
Data Science Experiments with Python
14 pages
Machine Learning Models Overview
No ratings yet
Machine Learning Models Overview
3 pages
I Avaliação Parcial - 25.0 PTS - Gabarito
No ratings yet
I Avaliação Parcial - 25.0 PTS - Gabarito
9 pages
CatBoost with Auto Class Weights
No ratings yet
CatBoost with Auto Class Weights
12 pages
Titanic Data Analysis with Python
No ratings yet
Titanic Data Analysis with Python
20 pages
Data Preprocessing and Model Evaluation Techniques
No ratings yet
Data Preprocessing and Model Evaluation Techniques
12 pages
Naïve Bayes Classifier Implementation
No ratings yet
Naïve Bayes Classifier Implementation
8 pages
Machine Learning Lab Manual for B.Tech
No ratings yet
Machine Learning Lab Manual for B.Tech
19 pages
Evaluating Model: Accuracy & F1 Score
No ratings yet
Evaluating Model: Accuracy & F1 Score
34 pages
Decision Tree Classifier Tutorial
No ratings yet
Decision Tree Classifier Tutorial
6 pages
Data Analysis and Visualization Techniques
No ratings yet
Data Analysis and Visualization Techniques
13 pages
Heart Disease Prediction Model
100% (1)
Heart Disease Prediction Model
73 pages
Machine Learning Algorithms in Python
No ratings yet
Machine Learning Algorithms in Python
8 pages
Iris Dataset Classification Models
No ratings yet
Iris Dataset Classification Models
19 pages
Data Analysis and Model Training Guide
No ratings yet
Data Analysis and Model Training Guide
7 pages
SVM ROC Curve for Fake Profile Detection
No ratings yet
SVM ROC Curve for Fake Profile Detection
8 pages
Anemia Level Prediction with Random Forest
No ratings yet
Anemia Level Prediction with Random Forest
7 pages
ANN Hyperparameter Tuning Results
No ratings yet
ANN Hyperparameter Tuning Results
3 pages
Oracle Certified MSE Lab Assignments
No ratings yet
Oracle Certified MSE Lab Assignments
15 pages
Logistic Regression Model Evaluation
No ratings yet
Logistic Regression Model Evaluation
7 pages
Machine Learning Practical File
No ratings yet
Machine Learning Practical File
36 pages
Diabetes Prediction with Sampling Methods
No ratings yet
Diabetes Prediction with Sampling Methods
2 pages
SVM and Random Forest Model Evaluation
100% (1)
SVM and Random Forest Model Evaluation
19 pages
Data Analysis and Machine Learning Techniques
No ratings yet
Data Analysis and Machine Learning Techniques
13 pages
Linear Regression and Classification Models
No ratings yet
Linear Regression and Classification Models
13 pages
Imbalanced Dataset Classification Metrics
No ratings yet
Imbalanced Dataset Classification Metrics
4 pages
Parkinson's Disease Prediction Guide
No ratings yet
Parkinson's Disease Prediction Guide
16 pages
Maternal Risk Prediction Models Analysis
No ratings yet
Maternal Risk Prediction Models Analysis
9 pages
KNN Diabetes Prediction Model Analysis
No ratings yet
KNN Diabetes Prediction Model Analysis
3 pages
Fisher Iris Classification Analysis
No ratings yet
Fisher Iris Classification Analysis
22 pages
Linear and Logistic Regression Techniques
No ratings yet
Linear and Logistic Regression Techniques
33 pages
Loan Prediction Model Evaluation
No ratings yet
Loan Prediction Model Evaluation
11 pages
Machine Learning Algorithms Overview
No ratings yet
Machine Learning Algorithms Overview
9 pages
Machine Learning Regression and Classification
No ratings yet
Machine Learning Regression and Classification
5 pages
Car Evaluation Data Analysis
No ratings yet
Car Evaluation Data Analysis
12 pages
Logistic Regression Model Evaluation Guide
No ratings yet
Logistic Regression Model Evaluation Guide
3 pages
KMeans Clustering with PCA Analysis
No ratings yet
KMeans Clustering with PCA Analysis
11 pages
Machine Learning for Payment Fraud Detection
No ratings yet
Machine Learning for Payment Fraud Detection
2 pages
Machine Learning Model Implementation
No ratings yet
Machine Learning Model Implementation
4 pages
CatBoost for Electricity Theft Detection
No ratings yet
CatBoost for Electricity Theft Detection
9 pages
Virtual DOM Performance Analysis
No ratings yet
Virtual DOM Performance Analysis
16 pages
Energy Simulation in Building Design Second Edition Joseph Clarke Latest PDF 2025
No ratings yet
Energy Simulation in Building Design Second Edition Joseph Clarke Latest PDF 2025
91 pages
Nguyen Tuan Anh CV
No ratings yet
Nguyen Tuan Anh CV
2 pages
Data Security and Cryptography Assignment
No ratings yet
Data Security and Cryptography Assignment
11 pages
NSR Registration Process Guide
No ratings yet
NSR Registration Process Guide
33 pages
Oracle Database Types and Objects Guide
No ratings yet
Oracle Database Types and Objects Guide
8 pages
Overview of Cyber Law in India
No ratings yet
Overview of Cyber Law in India
3 pages
Cybersecurity Fundamentals Syllabus
No ratings yet
Cybersecurity Fundamentals Syllabus
2 pages
eSim: Open Source Circuit Simulation Tool
No ratings yet
eSim: Open Source Circuit Simulation Tool
2 pages
6th Unit ST Notes
No ratings yet
6th Unit ST Notes
20 pages
Entrepreneurial Qualities and Stress Management
No ratings yet
Entrepreneurial Qualities and Stress Management
16 pages
2024 Property Tax Credit File Layout
No ratings yet
2024 Property Tax Credit File Layout
6 pages
Understanding Entity Types in E-R Models
No ratings yet
Understanding Entity Types in E-R Models
61 pages
Install Oracle 19c on RHEL 9 Guide
No ratings yet
Install Oracle 19c on RHEL 9 Guide
4 pages
Top Management's Role in Information Security
No ratings yet
Top Management's Role in Information Security
19 pages
TM 1703 ACP System Manual
No ratings yet
TM 1703 ACP System Manual
110 pages
Understanding Object-Oriented Programming
No ratings yet
Understanding Object-Oriented Programming
18 pages
IBM Selectric III Troubleshooting Guide
No ratings yet
IBM Selectric III Troubleshooting Guide
202 pages
Kalpurush Software in Microservices Review
No ratings yet
Kalpurush Software in Microservices Review
16 pages
IoT Patient Health Monitoring System
No ratings yet
IoT Patient Health Monitoring System
21 pages
30 Digital Experience Strategies
No ratings yet
30 Digital Experience Strategies
58 pages
Sampling Techniques and Data Analysis Guide
No ratings yet
Sampling Techniques and Data Analysis Guide
26 pages
Injection Attacks in Web Security Lab
No ratings yet
Injection Attacks in Web Security Lab
13 pages
27" FHD Medical Display FS-A2702DS
No ratings yet
27" FHD Medical Display FS-A2702DS
2 pages
Toshiba e-STUDIO Error Codes Guide
No ratings yet
Toshiba e-STUDIO Error Codes Guide
3 pages
Understanding SIMD Architecture in Computing
No ratings yet
Understanding SIMD Architecture in Computing
67 pages
Computer Basics: Memory & Hardware Quiz
No ratings yet
Computer Basics: Memory & Hardware Quiz
2 pages
SIP Call Flow Analysis and Debugging
No ratings yet
SIP Call Flow Analysis and Debugging
8 pages
B.Sc 1st Year Mathematics: Matrices & Series
No ratings yet
B.Sc 1st Year Mathematics: Matrices & Series
12 pages
SAP FICO Consultant Profile for Olam
No ratings yet
SAP FICO Consultant Profile for Olam
2 pages

Evaluate Machine Learning Models in Python

Uploaded by

Evaluate Machine Learning Models in Python

Uploaded by

Code:

import [Link] as plt

import seaborn as sns

from sklearn.model_selection import train_test_split

from [Link] import (

classification_report, confusion_matrix, roc_auc_score, accuracy_score, f1_score

from [Link] import LabelEncoder

from [Link] import RandomForestClassifier

from [Link] import SVC

# Load and process the dataset

df_expression = metabric_df.iloc[:, 30:519].join(metabric_df['overall_survival'], how='inner')

# Dictionary to store F1 and accuracy scores of each model

metrics_summary = {"Model": [], "F1 Score": [], "Accuracy": []}

# Function to evaluate and display results

def evaluate_model(model, X_train, X_test, y_train, y_test, model_name):

# Predictions and probabilities (if applicable)

y_proba = model.predict_proba(X_test)[:, 1] if hasattr(

model, 'predict_proba') else None

f1 = f1_score(y_test, y_pred, average='weighted')

accuracy = accuracy_score(y_test, y_pred)

# Store the metrics

# Display classification metrics

print(f"\n=== {model_name} ===")

print("Classification Report:\n", classification_report(y_test, y_pred))

print(f"F1 Score: {f1:.4f}")

# Confusion Matrix Visualization

[Link](cm, annot=True, fmt='d', cmap='Blues', xticklabels=[

'Pred 0', 'Pred 1'], yticklabels=['True 0', 'True 1'])

[Link](f'Confusion Matrix - {model_name}')

# AUC-ROC Score (if applicable)

if y_proba is not None:

print(f"AUC-ROC Score: {roc_auc_score(y_test, y_proba):.4f}")

# Main function to process the dataset and evaluate models

# Prepare the dataset

# Handle categorical variables

# Split the dataset

X_train, X_test, y_train, y_test = train_test_split(

# Define classifiers to be evaluated

'Random Forest': RandomForestClassifier(),

'Support Vector Classifier': SVC(probability=True),

# Train and evaluate all models

for name, model in [Link]():

evaluate_model(model, X_train, X_test, y_train, y_test, name)

# Plot F1 Scores of all models

y=metrics_summary["F1 Score"], palette='coolwarm')

[Link]('F1 Scores of All Models')

# Plot Accuracy Scores of all models

[Link]('Accuracy Scores of All Models')

# Load your dataset and specify the target column

# Replace with your dataframe

df = df_expression # Example input dataframe

target_column = 'overall_survival' # Replace with the actual target column name

You might also like