0% found this document useful (0 votes)

34 views15 pages

AI Model for Wafer Pass/Fail Prediction

The project focuses on developing an AI-based prediction model for classifying semiconductor wafers as pass or fail during testing, aiming to improve first-time yield rates and reduce retesting. Utilizing Python and machine learning libraries, the model achieved a precision score above 90% and demonstrated significant potential for cost savings and faster production. Future plans include deployment in real-time manufacturing environments and continuous improvement through feedback integration.

Uploaded by

doneilikeyou

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

34 views15 pages

AI Model for Wafer Pass/Fail Prediction

Uploaded by

doneilikeyou

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

INTEL - AI FOR MANUFACTURING

PROJECT
REPORT
for
Pass/Fail Prediction for Semiconductor Wafers

Prepared by :
Gosai Harshpari Sunilpari
Patel Jenil Mahendrakumar
Uneval Lalit Bharatbhai
TABLE OF
CONTENTS

PAGE-01 PAGE-06
OVERVIEW RESULTS

PAGE-03 PAGE-07
OBJECTIVES CONCLUSION

PAGE-04 PAGE-08
METHODOLOGY PROTOTYPE

PAGE-05 PAGE-13
TECHNOLOGIES USED IMPORTANT LINKS
OVERVIEW
Project Title : Pass/Fail Prediction for Semiconductor Wafers

Project Description : Semiconductor wafer manufacturing is a critical

step in electronics production. However, wafers often undergo retest
due to inaccurate prediction, causing time delay and increase cost.
This project implements AI based prediction model to identify
potential pass/fail outcomes during initial testing stage. By leveraging
data-driven insights, the model aims to improve first time pass rates
and streamline the manufacturing process.

Timeline :

Phase Duration

Problem Scoping 3 days

Data Acquisition 1 day

Data Exploration 2 days

Modeling 5 days

Evaluation 1 day

Report & Finalization 2 days

Benefits :

Reduce Production Delay

Reduces wafer retesting
Increases production rate

Team Members :

Gosai Harshpari Sunilpari - gosaiharsh8200@[Link]

Patel Jenil Mahendrakumar - jenilgajera19@[Link]
Uneval Lalit Bharatbhai - unevallalit6499@[Link]

Risks :

Model may not function well on unseen wafer design pattern

Any inaccuracy in data preprocessing can lead to biasing output
Lack of real-time data integrity can limit deployment
OBJECTIVES
Primary Objectives : Primary objective of this project is to develop an
AI-based prediction model to classify semiconductor wafers in Pass or
Fail during testing. The aim is to improve first time yield rates by
minimizing number of wafers that require retesting. By leveraging
historical wafer data and machine learning algorithms, the model is
designed to assist manufacturers in making faster, more reliable
decisions during the quality control process.

Secondary Objectives : To collect and preprocess historical wafer test

data to make them ready for model training and identifying key
parameters that influence wafer test outcomes. Also to prepare the
model for future integration in real-time production environment.

Measurable Goals :
Achieve at least 90% accuracy in classifying wafer pass/fail status
on the test dataset.
Reduce false positive (incorrectly predicting pass) rate.
Reduce the overall need for retesting wafers by good percentage,
based on historical retest trends.
METHODOLOGY
Approach : The project followed a data-driven, iterative machine
learning approach. The project was divided into distinct stages
including data preprocessing, model development, evaluation, and
result interpretation. Python and Jupyter Notebook were used for
implementation, supported by libraries such as Pandas, Scikit-learn,
and Matplotlib.

Phases : The project followed a standard AI project development cycle

to handle step by step functions. This include the phases like Problem
Scoping, Data Acquisition, Data Exploration, Modeling, Evaluation and
Deployment.

Deliverable :

Cleaned and preprocessed wafer dataset.

Graphs and charts for key parameters important for consideration.
Jupyter Notebook containing all code, plots, and metrics.
Project Report with result and conclusion.

Testing and Quality assurance : Testing was conducted using 70-30

train-test split to ensure model generalization. Evaluation metrics such
as F1-score were prioritized due to class imbalance in the data.
Confusion matrix analysis helped ensure the model minimized false
positives. Code validation included checking data pipeline
correctness, ensuring reproducibility, and avoiding data leakage.
TECHNOLOGIES
USED
Programming Language : Python programming language is used for all
stages of the project including preprocessing, model building,
evaluation and visualization. It was chosen due to its rich ecosystem of
machine learning libraries and its readability.

Development Framework & Libraries :

Pandas: For data loading, transformation, and manipulation.

NumPy: Used for numerical operations and efficient array
handling.
Matplotlib & Seaborn: Used for data visualization, including
countplot, and confusion matrices.
Scikit-learn: Provided tools for machine learning model
implementation , model evaluation , and utilities like train-test
splitting.

Development Tools :

Jupyter Notebook : The development environment where the

entire workflow — from data exploration to model evaluation — was
written and executed. Jupyter’s cell-based format made it easy to
test, debug, and document code inline.

Testing Tools :

Scikit-learn’s Evaluation suite : Metrics like confusion matrix,

classification report, accuracy, precision, recall, and F1-score were
used to validate the models.
RESULTS
Key Metrics : The model performance was evaluated using accuracy,
precision, recall, F1 score and confusion matrix. Below are the results
of the model

Metric Score (%)

Accuracy 67

Precision 96

Recall 70

F1 score 80

Return on investment (ROI) :

Reduction in Retesting Costs: By predicting pass/fail outcomes
accurately, the model reduces unnecessary retests, saving both
machine time and labor.
Faster Production : Manufacturer can make quick decision about
Pass/Fail for wafer, accelerating wafer flow on production line
Improved Yield Quality: With a precision score above 90%, the
model helps in avoiding the release of faulty wafers into further
stages.
CONCLUSION
Recap : This project is focused on developing an AI-based to predict
the Pass/Fail status of the semiconductor wafer. Using Python and
machine learning frameworks multiple models were built and
evaluated based on key classification metrics. The project followed a
structured methodology from data preprocessing and model training
to testing and evaluation to ensure the model’s robustness and
accuracy.

Key Takeaways :
A high-performing prediction model was developed with precision
exceeding 95%, significantly reducing the likelihood of false
classifications.
Among the models tested, Logistic Regression achieved the best
balance between precision, recall, and F1-score.
The entire project was implemented using open-source
technologies, making it a cost-effective solution for smart
manufacturing.

Future Plan :
Deployment in a production environment, possibly through API
integration or real-time monitoring dashboards.
Integration with live manufacturing systems, including data
streaming from wafer testing equipment.
Feedback loop integration to allow the model to improve over time
with new wafer test data.
PROTOTYPE

Importing important libraries and loading data set into variable called
dataset.

Performing Exploratory Data Analysis where exploration and

summarization of the main characteristic of data is done.
Visualizing the class distribution by plotting bar chart which shows
how many samples belong to each class.

Checking for missing values and selecting categorical columns for

more processing.
Performing Data Preprocessing by analyzing categorical features,
removing irrelevant data, splitting features and labels and imputing
missing values.

Dataset is converted in training and testing sets as 70% training data

and 30% testing data.

Performing Normalization by applying StandardScaler from sklearn to

the features. (Mean = 0 and Standard deviation = 1)
Doing dimensionality reduction using principal component analysis to
reduce feature dimensions and noise.

Creating and training a logistic regression model on the PCA reduced

training data.

Evaluating performance of the model on test data based on

parameters like accuracy, classification report and confusion matrix.
Predicting the class and probability for the randomly selected sample.
This helps to evaluate model confidence and correctness on a real-
world test case.
IMPORTANT LINKS

Github Link :
For the Jupyter Notebook file
[Link]

Google Drive Link :

For the Dataset (.csv) file
[Link]
s/view?usp=sharing

AI-Driven Fault Isolation in Semiconductors
No ratings yet
AI-Driven Fault Isolation in Semiconductors
30 pages
Yield Prediction in Semiconductor Processes
No ratings yet
Yield Prediction in Semiconductor Processes
2 pages
Predictive Maintenance ML Project Guide
No ratings yet
Predictive Maintenance ML Project Guide
3 pages
Semiconductor Yield Prediction Project
No ratings yet
Semiconductor Yield Prediction Project
2 pages
New York Taxi Fare Prediction Project
No ratings yet
New York Taxi Fare Prediction Project
6 pages
Predictive Analytics Assignment Overview
No ratings yet
Predictive Analytics Assignment Overview
3 pages
Predictive API for Manufacturing Data
No ratings yet
Predictive API for Manufacturing Data
2 pages
AI Solutions for Industry Optimization
No ratings yet
AI Solutions for Industry Optimization
6 pages
Data Science Internship Report Summary
No ratings yet
Data Science Internship Report Summary
15 pages
Machine Learning for Predictive Maintenance
No ratings yet
Machine Learning for Predictive Maintenance
4 pages
Data Scientist at Niscom Tele Infra
No ratings yet
Data Scientist at Niscom Tele Infra
2 pages
Feature Engineering in AI: Techniques & Methods
No ratings yet
Feature Engineering in AI: Techniques & Methods
21 pages
Data Analysis and Modeling Workflow
No ratings yet
Data Analysis and Modeling Workflow
2 pages
Machine Learning for Copper Pricing Insights
No ratings yet
Machine Learning for Copper Pricing Insights
1 page
Data Science Use Cases and Projects
No ratings yet
Data Science Use Cases and Projects
44 pages
AI Internship Report Overview
No ratings yet
AI Internship Report Overview
13 pages
AI Project Framework and Ethics Guide
No ratings yet
AI Project Framework and Ethics Guide
24 pages
Predicting Lithium-Ion Battery Quality
No ratings yet
Predicting Lithium-Ion Battery Quality
66 pages
AI/ML Project Report Template Guide
No ratings yet
AI/ML Project Report Template Guide
14 pages
Industrial AI for Predictive Maintenance
No ratings yet
Industrial AI for Predictive Maintenance
3 pages
JMP Predictive Modeling in Semiconductors
No ratings yet
JMP Predictive Modeling in Semiconductors
17 pages
AI-Driven Reliability in Manufacturing
No ratings yet
AI-Driven Reliability in Manufacturing
121 pages
CCS364 Soft Computing Lab Record
100% (1)
CCS364 Soft Computing Lab Record
35 pages
Data Analytics for Predictive Maintenance
No ratings yet
Data Analytics for Predictive Maintenance
10 pages
Advanced Defect Detection System
No ratings yet
Advanced Defect Detection System
6 pages
Machine Learning in Semiconductor Testing
No ratings yet
Machine Learning in Semiconductor Testing
8 pages
Machine Learning for Student Engagement
No ratings yet
Machine Learning for Student Engagement
54 pages
PoC Dataset Requirements for SORBA.ai
No ratings yet
PoC Dataset Requirements for SORBA.ai
2 pages
Data Scientist Resume and Skills Overview
No ratings yet
Data Scientist Resume and Skills Overview
2 pages
UCI Student Performance Dataset Analysis
No ratings yet
UCI Student Performance Dataset Analysis
11 pages
Zero Defect and Risk Mitigation With Advanced Analytics
No ratings yet
Zero Defect and Risk Mitigation With Advanced Analytics
52 pages
AI Solutions for Physical Verification
No ratings yet
AI Solutions for Physical Verification
152 pages
Cyber Café Management System Report
No ratings yet
Cyber Café Management System Report
36 pages
AI & ML Assignment Guidelines 2024
No ratings yet
AI & ML Assignment Guidelines 2024
3 pages
Predicting Manufacturing Equipment Failure
No ratings yet
Predicting Manufacturing Equipment Failure
7 pages
Data Science Lab 6: Feature Engineering
No ratings yet
Data Science Lab 6: Feature Engineering
2 pages
AI Sports Outcome Prediction Models
No ratings yet
AI Sports Outcome Prediction Models
45 pages
AI Solutions for Education and Traffic Management
No ratings yet
AI Solutions for Education and Traffic Management
83 pages
Predictive Maintenance for Wind Energy
No ratings yet
Predictive Maintenance for Wind Energy
5 pages
Predicting Student Performance with AI
No ratings yet
Predicting Student Performance with AI
10 pages
Data Science Internship Report at CodSoft
No ratings yet
Data Science Internship Report at CodSoft
7 pages
Cybersecurity Incident Classification Model
No ratings yet
Cybersecurity Incident Classification Model
5 pages
Predicting CPU Performance Scores
No ratings yet
Predicting CPU Performance Scores
2 pages
AI Project Workflow Overview
No ratings yet
AI Project Workflow Overview
10 pages
Solar Yield Prediction Using IOT Data
No ratings yet
Solar Yield Prediction Using IOT Data
20 pages
Image Classification with CNNs in Python
No ratings yet
Image Classification with CNNs in Python
17 pages
Important Questions
No ratings yet
Important Questions
4 pages
AI Course Certificate and Experiments
No ratings yet
AI Course Certificate and Experiments
69 pages
Predicting Telecom Customer Churn
No ratings yet
Predicting Telecom Customer Churn
7 pages
Predicting Hiring Outcomes with ML
No ratings yet
Predicting Hiring Outcomes with ML
13 pages
Data Scientist with Machine Learning Expertise
No ratings yet
Data Scientist with Machine Learning Expertise
4 pages
Machine Learning Skill Workbook 2024-25
No ratings yet
Machine Learning Skill Workbook 2024-25
42 pages
Predicting QC Failures in Bosch Production
No ratings yet
Predicting QC Failures in Bosch Production
3 pages
MLOps: Building Effective ML Systems
No ratings yet
MLOps: Building Effective ML Systems
68 pages
AI & ML Exam Model Answers 2023
No ratings yet
AI & ML Exam Model Answers 2023
20 pages
AI & ML Exam Model Answers
No ratings yet
AI & ML Exam Model Answers
21 pages
Data Science Internship Report Summary
No ratings yet
Data Science Internship Report Summary
14 pages
Multiclass Metrics for Iris Classification
No ratings yet
Multiclass Metrics for Iris Classification
6 pages
Questionnaire Design in Nursing Research
No ratings yet
Questionnaire Design in Nursing Research
10 pages
Yield Curve Risk Measurement Techniques
No ratings yet
Yield Curve Risk Measurement Techniques
13 pages
Subspace Identification Methods Framework
No ratings yet
Subspace Identification Methods Framework
6 pages
PCA for Stabilometric Signal Area Calculation
No ratings yet
PCA for Stabilometric Signal Area Calculation
9 pages
Eigenvector Overlap in Random Matrices
No ratings yet
Eigenvector Overlap in Random Matrices
32 pages
Network Intrusion Detection with XGBoost
No ratings yet
Network Intrusion Detection with XGBoost
6 pages
Upper-Limb Exoskeleton Dynamics Simulation
No ratings yet
Upper-Limb Exoskeleton Dynamics Simulation
8 pages
Landslide Susceptibility Prediction Review
No ratings yet
Landslide Susceptibility Prediction Review
33 pages
Solar Irradiance Variability in Asia-Pacific
No ratings yet
Solar Irradiance Variability in Asia-Pacific
16 pages
Media Multitasking Scale for Adolescents
No ratings yet
Media Multitasking Scale for Adolescents
7 pages
Face Recognition & Emotion Detection System
No ratings yet
Face Recognition & Emotion Detection System
6 pages
Factors Influencing Indian Stock Market
No ratings yet
Factors Influencing Indian Stock Market
12 pages
Data Analysis and Statistics Overview
No ratings yet
Data Analysis and Statistics Overview
8 pages
AprilTag 2: Enhanced Fiducial Detection
No ratings yet
AprilTag 2: Enhanced Fiducial Detection
6 pages
AI & ML Interview Prep Guide
No ratings yet
AI & ML Interview Prep Guide
15 pages
Meta-Learning for Robust Modulation Classification
No ratings yet
Meta-Learning for Robust Modulation Classification
6 pages
Mathematics in Data Science Overview
No ratings yet
Mathematics in Data Science Overview
34 pages
RoSA: Efficient Fine-Tuning Method
No ratings yet
RoSA: Efficient Fine-Tuning Method
20 pages
QbD and PAT in Pharmaceutical Industry
No ratings yet
QbD and PAT in Pharmaceutical Industry
5 pages
Deep Learning Course Syllabus
100% (2)
Deep Learning Course Syllabus
2 pages
Ankon L35 Engineering Overview
No ratings yet
Ankon L35 Engineering Overview
10 pages
AI Concepts Illustrated in 100 Images
No ratings yet
AI Concepts Illustrated in 100 Images
104 pages
Marketing Intelligence in SMEs: Insights
No ratings yet
Marketing Intelligence in SMEs: Insights
23 pages
Nonnegative Matrix Factorization Tutorial
No ratings yet
Nonnegative Matrix Factorization Tutorial
189 pages
A19 Image Compression Using Pca Technique
No ratings yet
A19 Image Compression Using Pca Technique
14 pages
Vectors and Matrices in Machine Learning
No ratings yet
Vectors and Matrices in Machine Learning
6 pages
SVD Quiz for PCA in Machine Learning
100% (1)
SVD Quiz for PCA in Machine Learning
7 pages
Real-Time Fault Detection in TEP
No ratings yet
Real-Time Fault Detection in TEP
6 pages
MBS Prepayment Risk Analysis Report
No ratings yet
MBS Prepayment Risk Analysis Report
29 pages

AI Model for Wafer Pass/Fail Prediction

Uploaded by

AI Model for Wafer Pass/Fail Prediction

Uploaded by

INTEL - AI FOR MANUFACTURING

Project Description : Semiconductor wafer manufacturing is a critical

Problem Scoping 3 days

Data Acquisition 1 day

Data Exploration 2 days

Report & Finalization 2 days

Reduce Production Delay

Gosai Harshpari Sunilpari - gosaiharsh8200@[Link]

Model may not function well on unseen wafer design pattern

Secondary Objectives : To collect and preprocess historical wafer test

Phases : The project followed a standard AI project development cycle

Cleaned and preprocessed wafer dataset.

Testing and Quality assurance : Testing was conducted using 70-30

Development Framework & Libraries :

Pandas: For data loading, transformation, and manipulation.

Jupyter Notebook : The development environment where the

Scikit-learn’s Evaluation suite : Metrics like confusion matrix,

Metric Score (%)

Return on investment (ROI) :

Performing Exploratory Data Analysis where exploration and

Checking for missing values and selecting categorical columns for

Dataset is converted in training and testing sets as 70% training data

Performing Normalization by applying StandardScaler from sklearn to

Creating and training a logistic regression model on the PCA reduced

Evaluating performance of the model on test data based on

Google Drive Link :

You might also like