Knowledge Discovery Database (KDD Process)

KDD (Knowledge Discovery in Databases) is a computer science field focused on extracting useful information from large datasets, with Data Mining being a key step in this process. The KDD process involves several steps including data integration, selection, cleaning, transformation, mining, evaluation, and decision-making. It is widely applied in various domains such as marketing, fraud detection, and social network analysis to derive business intelligence from data.

Uploaded by

komalbhagat8803

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

271 views5 pages

Knowledge Discovery Database (KDD Process)

Uploaded by

komalbhagat8803

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

Knowledge Discovery Database(Kdd Process)

KDD (Knowledge Discovery in Databases) is a field of computer science, which includes the tools and
theories to help humans in extracting useful and previously unknown information (i.e. knowledge) from
large collections of digitized data. KDD consists of several steps, and Data Mining is one of them. Data
Mining is application of a specific algorithm in order to extract patterns from data. Nonetheless, KDD and
Data Mining are used interchangeably.

KDD has become a very important process to convert this large wealth of data in to business
intelligence, as manual extraction of patterns has become seemingly impossible in the past few
decades. For example, it is currently been used for various applications such as social network
analysis, fraud detection, science, investment, manufacturing, telecommunications, data cleaning,
sports, information retrieval and largely for marketing. KDD is usually used to answer questions like
what are the main products that might help to obtain high profit next year in Wal-Mart?. This process
has several steps. It starts with developing an understanding of the application domain and the goal
and then creating a target dataset. This is followed by cleaning, preprocessing, reduction and
projection of data
What is the difference between KDD and Data mining?
KDD is the overall process of extracting knowledge from data while Data Mining is
a step inside the KDD process, which deals with identifying patterns in data.

The process of finding and interpreting patterns from data involves the repeated
application of the following steps:

a. Data Integration
First of all the data is collected and integrated from all the different sources.

b. Data Selection
Generally, we may not all the data we have collected in the first step. Also, in this step, we select only
those data which we think useful for data mining.
c. Data Cleaning
Generally, the data we have collected is not clean and may contain errors, missing values, noisy or
inconsistent data. Therefore we need to apply different techniques to get rid of such anomalies.

d. Data Transformation
Basically, the data even after cleaning is not ready for mining. Also, we need to transform them into forms
appropriate for mining. Thus, the techniques used to do this are smoothing, aggregation, normalization etc.

e. Data Mining
As now in this step, we are ready to apply data mining techniques on the data. Basically, it is to discover the
interesting patterns. Hence, clustering and association analysis are among the many different techniques
present. Also, as we used for data mining.

f. Pattern Evaluation and Knowledge Presentation

Generally, this step includes visualization, transformation, removing redundant patterns from the patterns we
generated.

g. Decisions / Use of Discovered Knowledge

As this step is beneficial to us. Also, it helps to use the knowledge acquired to take better decisions.

Dmbi Unit-3
No ratings yet
Dmbi Unit-3
21 pages
Data Mining and KDD
No ratings yet
Data Mining and KDD
15 pages
What Is The KDD Process
No ratings yet
What Is The KDD Process
2 pages
NCVRT Datamining
No ratings yet
NCVRT Datamining
43 pages
Fund Data Science
No ratings yet
Fund Data Science
91 pages
KDD
No ratings yet
KDD
3 pages
Unit Iii
No ratings yet
Unit Iii
33 pages
Data Mining for Analysts
No ratings yet
Data Mining for Analysts
14 pages
Assignment Solution
No ratings yet
Assignment Solution
27 pages
Data Mining Unit 1
No ratings yet
Data Mining Unit 1
22 pages
Unit 1
No ratings yet
Unit 1
43 pages
Chapter 3 DATA MINIG
No ratings yet
Chapter 3 DATA MINIG
17 pages
DM Course Material
No ratings yet
DM Course Material
128 pages
Data Structures: Notes For Lecture 12 Introduction To Data Mining by Samaher Hussein Ali
No ratings yet
Data Structures: Notes For Lecture 12 Introduction To Data Mining by Samaher Hussein Ali
4 pages
DWM 4
No ratings yet
DWM 4
23 pages
DWDM Unit II
No ratings yet
DWDM Unit II
18 pages
Understanding the KDD Process in Data Mining
No ratings yet
Understanding the KDD Process in Data Mining
5 pages
Data Mining
No ratings yet
Data Mining
25 pages
Datamining&warehousing
No ratings yet
Datamining&warehousing
65 pages
Data Preprocessing Personal
No ratings yet
Data Preprocessing Personal
11 pages
DMW ALLinONE
No ratings yet
DMW ALLinONE
64 pages
A412793405 20 2024 Lect2
No ratings yet
A412793405 20 2024 Lect2
8 pages
KDD Vs Data Mining
No ratings yet
KDD Vs Data Mining
2 pages
Data Mining Basics and KDD Process
No ratings yet
Data Mining Basics and KDD Process
16 pages
Data Mining Versus Knowledge Discovery I
No ratings yet
Data Mining Versus Knowledge Discovery I
3 pages
Data Mining Essentials for Students
No ratings yet
Data Mining Essentials for Students
15 pages
Chapter - 5 - Data Mining
No ratings yet
Chapter - 5 - Data Mining
18 pages
Overview of The KDD Process
No ratings yet
Overview of The KDD Process
3 pages
Understanding Data Mining Concepts
No ratings yet
Understanding Data Mining Concepts
44 pages
Data Mining 14
No ratings yet
Data Mining 14
3 pages
Unit 1 DM
No ratings yet
Unit 1 DM
16 pages
PPT-DWDM Unit 3
No ratings yet
PPT-DWDM Unit 3
106 pages
cc15 2nd
No ratings yet
cc15 2nd
2 pages
1.1 DM-intro
No ratings yet
1.1 DM-intro
25 pages
Introduction to Data Mining Concepts
No ratings yet
Introduction to Data Mining Concepts
17 pages
New Note
No ratings yet
New Note
23 pages
Understanding Data Mining Techniques
No ratings yet
Understanding Data Mining Techniques
39 pages
Data Cube in Relational Databases
No ratings yet
Data Cube in Relational Databases
121 pages
Lect 1 2 Data Mining 3
No ratings yet
Lect 1 2 Data Mining 3
19 pages
Fundamentals of Data Science Notes (Module - 1)
No ratings yet
Fundamentals of Data Science Notes (Module - 1)
19 pages
Introduction To Data Mining
No ratings yet
Introduction To Data Mining
38 pages
Data Mining Introduction
No ratings yet
Data Mining Introduction
52 pages
5 Data Mining Proccess and Techniques - Week 7
No ratings yet
5 Data Mining Proccess and Techniques - Week 7
61 pages
Data Mining & KDD Overview
No ratings yet
Data Mining & KDD Overview
22 pages
Data Mining & Knowledge Discovery
No ratings yet
Data Mining & Knowledge Discovery
60 pages
Unit III DWDM
No ratings yet
Unit III DWDM
113 pages
FDS Unit 1 Notes
No ratings yet
FDS Unit 1 Notes
30 pages
DM Module1
No ratings yet
DM Module1
15 pages
Data Mining Mids
No ratings yet
Data Mining Mids
24 pages
DM Unit - 3
No ratings yet
DM Unit - 3
10 pages
Data Mining for Business Insights
100% (3)
Data Mining for Business Insights
11 pages
Chapter 7
No ratings yet
Chapter 7
26 pages
Introduction to Data Mining Techniques
No ratings yet
Introduction to Data Mining Techniques
11 pages
DWDM Unit-II Notes
No ratings yet
DWDM Unit-II Notes
29 pages
KDD Process in Data Mining
No ratings yet
KDD Process in Data Mining
11 pages
DWDM Unit 3
No ratings yet
DWDM Unit 3
16 pages
Data Mining
No ratings yet
Data Mining
3 pages
Open CC and Get 10K Instantly Approved
89% (35)
Open CC and Get 10K Instantly Approved
6 pages
Black Book of Crime
75% (20)
Black Book of Crime
39 pages
Tools List
85% (27)
Tools List
2 pages
56 Pages of Methods
88% (116)
56 Pages of Methods
49 pages
Find Username, Password & CVV Data Using Google Dorks
100% (24)
Find Username, Password & CVV Data Using Google Dorks
5 pages
7839+ Awesome Deep Web Onion Links List (Uncensored Content) PDF
76% (38)
7839+ Awesome Deep Web Onion Links List (Uncensored Content) PDF
391 pages
Fraud Tactics for Beginners
77% (48)
Fraud Tactics for Beginners
6 pages
What Is Virtual Credit Card?
75% (44)
What Is Virtual Credit Card?
6 pages
2024 Latest Cashapp Method 1-2
83% (35)
2024 Latest Cashapp Method 1-2
7 pages
How To Write Track 1 & 2 Dumps With PIN 2022
81% (16)
How To Write Track 1 & 2 Dumps With PIN 2022
7 pages
20 Carding Videos + 55 Methods Cash
78% (27)
20 Carding Videos + 55 Methods Cash
3 pages
Dark Web Access Guide with TOR
91% (33)
Dark Web Access Guide with TOR
5 pages
Hella Methods Here
89% (28)
Hella Methods Here
17 pages
Complete Cracking and Bin Utilizing Course by Rishab
100% (7)
Complete Cracking and Bin Utilizing Course by Rishab
128 pages
Dumps With Pin Cashout Tutorials. PDF
95% (22)
Dumps With Pin Cashout Tutorials. PDF
10 pages
Bill Me Later Carding Tutorial Guide
89% (18)
Bill Me Later Carding Tutorial Guide
2 pages
Dump Trackssjs
40% (30)
Dump Trackssjs
88 pages
30 Best Tor Sites For Any and Everything You'll Ever Need! - Your Hacker
90% (41)
30 Best Tor Sites For Any and Everything You'll Ever Need! - Your Hacker
8 pages
Fraud Resources & Tools 2021
94% (64)
Fraud Resources & Tools 2021
5 pages
Hitting Logs
77% (13)
Hitting Logs
3 pages
(Doi 10.1016 - B978-0-323-43044-9.00130-8) Murray, Michael T. - Textbook of Natural Medicine - Zingiber Officinale (Ginger)
No ratings yet
(Doi 10.1016 - B978-0-323-43044-9.00130-8) Murray, Michael T. - Textbook of Natural Medicine - Zingiber Officinale (Ginger)
8 pages
Casteism
No ratings yet
Casteism
2 pages
University of Sussex Dissertation Format
100% (2)
University of Sussex Dissertation Format
7 pages
Coffee and Snack Menu Overview
No ratings yet
Coffee and Snack Menu Overview
1 page
Valuation Myths for Finance Experts
No ratings yet
Valuation Myths for Finance Experts
21 pages
Social Policy Theory and Practice 3. Ed. Edition Spicker Ebook Full Series Edition
100% (4)
Social Policy Theory and Practice 3. Ed. Edition Spicker Ebook Full Series Edition
110 pages
Ms
No ratings yet
Ms
3 pages
Essential Communication Skills Guide
No ratings yet
Essential Communication Skills Guide
532 pages
Protection Devices
No ratings yet
Protection Devices
15 pages
Sri Lanka's Monetary Policy Update
No ratings yet
Sri Lanka's Monetary Policy Update
7 pages
Forest Management Planning
No ratings yet
Forest Management Planning
13 pages
Product Brief QN8036: High Performance Digital FM Transceiver For Portable Devices
No ratings yet
Product Brief QN8036: High Performance Digital FM Transceiver For Portable Devices
3 pages
Alons Book Review - Preprint
No ratings yet
Alons Book Review - Preprint
10 pages
A Literary Review On Shallaki (Boswelllia Serrata Roxb) : Dr. Pushpa and Prof. Kamini Kaushal
No ratings yet
A Literary Review On Shallaki (Boswelllia Serrata Roxb) : Dr. Pushpa and Prof. Kamini Kaushal
15 pages
UK Chemistry Olympiad 2013 Report
No ratings yet
UK Chemistry Olympiad 2013 Report
3 pages
67 Electrical Technology 4th Sem
No ratings yet
67 Electrical Technology 4th Sem
46 pages
GARLANDTHOMSON MisfitsFeministMaterialist 2011
No ratings yet
GARLANDTHOMSON MisfitsFeministMaterialist 2011
20 pages
Disaster Types and Effects Guide
No ratings yet
Disaster Types and Effects Guide
16 pages
Causes of Inflation in Pakistan
No ratings yet
Causes of Inflation in Pakistan
10 pages
Key Figures and Policies of the New Deal
No ratings yet
Key Figures and Policies of the New Deal
3 pages
Internship Acceptance for Aditi Prasad
No ratings yet
Internship Acceptance for Aditi Prasad
2 pages
The Yoga Sutras of Patanjali Commentary On The Raja Yoga Sutras by Sri Swami Satchidananda (Swami Satchidananda)
100% (2)
The Yoga Sutras of Patanjali Commentary On The Raja Yoga Sutras by Sri Swami Satchidananda (Swami Satchidananda)
250 pages
The use of πρóς, προτί and ποτί in Homer
No ratings yet
The use of πρóς, προτί and ποτί in Homer
7 pages
Management Canadian 11th Edition Robbins Solutions Manual
100% (44)
Management Canadian 11th Edition Robbins Solutions Manual
12 pages
Cso Against Terrorism
No ratings yet
Cso Against Terrorism
236 pages
Islamic Philosophy Research Hub
No ratings yet
Islamic Philosophy Research Hub
1 page
Engineers' Guide to Insulation Testing
No ratings yet
Engineers' Guide to Insulation Testing
5 pages
NPOP Certification Bodies
No ratings yet
NPOP Certification Bodies
16 pages
Long Quiz in Math 5
No ratings yet
Long Quiz in Math 5
8 pages
English Translation - Seven Verses of Fakir Lalon Shah-Libre
No ratings yet
English Translation - Seven Verses of Fakir Lalon Shah-Libre
16 pages

Knowledge Discovery Database (KDD Process)

Uploaded by

Knowledge Discovery Database (KDD Process)

Uploaded by

Knowledge Discovery Database(Kdd Process)

f. Pattern Evaluation and Knowledge Presentation

g. Decisions / Use of Discovered Knowledge

You might also like