Data Mining

Data mining is the process of analyzing large amounts of data to discover useful patterns and relationships. It involves using software to extract patterns from raw data. Businesses use data mining to gain insights into customer behavior and improve marketing strategies. Common data mining techniques include classification, clustering, regression, association rule learning, outlier detection, and discovering sequential patterns.

Uploaded by

akashsharma9011328268

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

16 views

Data Mining

Uploaded by

akashsharma9011328268

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 15

Data Mining

What is Data Mining?

• In simple words, data mining is defined as a process used to extract
usable data from a larger set of any raw data. It implies analysing data
patterns in large batches of data using one or more software.
• Data mining is a process used by companies to turn raw data into
useful information. By using software to look for patterns in large
batches of data, businesses can learn more about their customers to
develop more effective marketing strategies, increase sales and
decrease costs. Data mining depends on effective data collection,
warehousing, and computer processing.
What is Data Mining?
• Data mining is the process of analyzing massive volumes of data to
discover business intelligence that helps companies solve problems,
mitigate risks, and seize new opportunities.

• The most commonly accepted definition of “data mining” is the

discovery of “models” for data. A “model,” however, can be one of
several things.
What is Data Mining?
• Statistical Modelling
• Machine Learning
• Computational Approaches to Modelling
What is Data Mining?
Statistical Modelling
• Statisticians were the first to use the term “data mining.”
• statisticians view data mining as the construction of a statistical model,
that is, an underlying distribution from which the visible data is drawn.
Example :
• Suppose our data is a set of numbers. A statistician might decide that
the data comes from a Gaussian distribution and use a formula to
compute the most likely parameters of this Gaussian. The mean and
standard deviation of this Gaussian distribution completely characterize
the distribution and would become the model of the data.
What is Data Mining?
Machine Learning
• Few scientists regard data mining as synonymous with machine
learning.
• There is no question that some data mining appropriately uses
algorithms from machine learning. Machine-learning practitioners use
the data as a training set.
• To train an algorithm of one of the many types used by machine-
learning practitioners, such as Bayes nets, support-vector machines,
decision trees, hidden Markov models, and many others.
What is Data Mining?
Machine Learning
• The typical case where machine learning is a good approach is when
we have little idea of what we are looking for in the data.
• On the other hand, machine learning has not proved successful in
situations where we can describe the goals of the mining more
directly.
What is Data Mining?
Computational Approaches to Modelling
• More recently, computer scientists have looked at data mining as an
algorithmic problem. In this case, the model of the data is simply the
answer to a complex query about it.
• There are many different approaches to modelling data. Most other
approaches to modelling can be described as either
• Summarizing the data succinctly and approximately
• Extracting the most prominent features of the data and ignoring the rest.
What is Data Mining?
Summarization
• Web mining, the entire complex structure of the Web is summarized
by a single number for each page.
• Most interesting forms of summarization is the PageRank idea, which
made Google successful.
• Another important form of summary – clustering
• Data is viewed as points in a multidimensional space. Points that are
“close” in this space are assigned to the same cluster.
What is Data Mining?
Feature Extraction
• A complex relationship between objects is represented by finding the
strongest statistical dependencies among these objects and using only
those in representing all statistical connections.
• Some of the important kinds of feature extraction from large-scale
data
• Frequent Itemsets
This model makes sense for data that consists of “baskets” of small
sets of items, as in the market-basket problem
What is Data Mining?
Feature Extraction
• Similar Items. Data looks like a collection of sets, and the objective is
to find pairs of sets that have a relatively large fraction of their
elements in common. Process known as “Collaborative Filtering”.
• Collaborative Filtering is the most common technique used when it
comes to building intelligent recommender systems that can learn to
give better recommendations as more information about users is
collected.
Data Mining Techniques
• Classification:
This analysis is used to retrieve important and relevant information
about data, and metadata. This data mining method helps to classify
data in different classes.
• Clustering:
Clustering analysis is a data mining technique to identify data that are
like each other. This process helps to understand the differences and
similarities between the data.
• Regression:
Regression analysis is the data mining method of identifying and
analyzing the relationship between variables. It is used to identify the
likelihood of a specific variable, given the presence of other variables.
• Association Rules:
This data mining technique helps to find the association between two
or more Items. It discovers a hidden pattern in the data set.
• Outer detection:
This type of data mining technique refers to observation of data items
in the dataset which do not match an expected pattern or expected
behavior. This technique can be used in a variety of domains, such as
intrusion, detection, fraud or fault detection, etc. Outer detection is
also called Outlier Analysis or Outlier mining.
• Sequential Patterns:
This data mining technique helps to discover or identify similar patterns
or trends in transaction data for certain period.

SBI SO Previous Year Paper IT Systems
0% (2)
SBI SO Previous Year Paper IT Systems
7 pages
Information Technology Unit 1 Internal Assessment
100% (2)
Information Technology Unit 1 Internal Assessment
25 pages
Data Mining Notes
No ratings yet
Data Mining Notes
9 pages
Unit 3 PPT (BA)
No ratings yet
Unit 3 PPT (BA)
19 pages
Introduction To Data Mining For Business Analytics
No ratings yet
Introduction To Data Mining For Business Analytics
51 pages
Mining in Social Media (Part 1) : Unit 3
No ratings yet
Mining in Social Media (Part 1) : Unit 3
15 pages
BIDW Lecture 2
No ratings yet
BIDW Lecture 2
33 pages
DWDM 1
No ratings yet
DWDM 1
17 pages
Data Mining
No ratings yet
Data Mining
87 pages
LECTURE NOTES ON DATA MINING and DATA WA
No ratings yet
LECTURE NOTES ON DATA MINING and DATA WA
84 pages
Data Mining - Prashant
No ratings yet
Data Mining - Prashant
10 pages
BDA Class1
No ratings yet
BDA Class1
33 pages
DM NOTES
No ratings yet
DM NOTES
91 pages
Data Mining - An Overview
No ratings yet
Data Mining - An Overview
40 pages
Unit-I Data Mining
No ratings yet
Unit-I Data Mining
28 pages
Data Mining Notes
100% (1)
Data Mining Notes
75 pages
Data Mining-CH5
No ratings yet
Data Mining-CH5
49 pages
Unit 3 Data Mining
No ratings yet
Unit 3 Data Mining
21 pages
DataMiningTechniques
No ratings yet
DataMiningTechniques
24 pages
Chapter 1&2
No ratings yet
Chapter 1&2
91 pages
Chapter 1
No ratings yet
Chapter 1
55 pages
08 Banerjee and Banerjee Business Analytics Ch08
No ratings yet
08 Banerjee and Banerjee Business Analytics Ch08
14 pages
Lecture 2
No ratings yet
Lecture 2
18 pages
DM UNIT -3
No ratings yet
DM UNIT -3
10 pages
Data Mining Techniques Unit-1
No ratings yet
Data Mining Techniques Unit-1
122 pages
Data Mining Notes
No ratings yet
Data Mining Notes
82 pages
Adm Unit - 1
No ratings yet
Adm Unit - 1
62 pages
Data Science PDF
No ratings yet
Data Science PDF
11 pages
UNIT-2 BI
No ratings yet
UNIT-2 BI
26 pages
Module 4
No ratings yet
Module 4
54 pages
DM Notes-1
No ratings yet
DM Notes-1
71 pages
Lecture 1428550844
No ratings yet
Lecture 1428550844
87 pages
Lec 02
No ratings yet
Lec 02
33 pages
Data Mining
No ratings yet
Data Mining
20 pages
Unit 1 Datamining For Business Intelligence
No ratings yet
Unit 1 Datamining For Business Intelligence
101 pages
Motivation For Data Mining The Information Crisis
No ratings yet
Motivation For Data Mining The Information Crisis
13 pages
Data Mining Process, Techniques, Tools & Examples
No ratings yet
Data Mining Process, Techniques, Tools & Examples
11 pages
CSC 425 Data Mining and Warehousing 2024
No ratings yet
CSC 425 Data Mining and Warehousing 2024
54 pages
Unit 3
No ratings yet
Unit 3
34 pages
Data Mining Implementation
No ratings yet
Data Mining Implementation
9 pages
data mining
No ratings yet
data mining
44 pages
DMDW Lecture Notes
No ratings yet
DMDW Lecture Notes
24 pages
Unit 3: by Dr. Anand Vyas
No ratings yet
Unit 3: by Dr. Anand Vyas
20 pages
DWM Notes Class by Proff
No ratings yet
DWM Notes Class by Proff
88 pages
Unit 3
No ratings yet
Unit 3
33 pages
UNIT 3 DWM NOTES
No ratings yet
UNIT 3 DWM NOTES
17 pages
DATA Mining
No ratings yet
DATA Mining
21 pages
Data Mining
No ratings yet
Data Mining
41 pages
DM Module1
No ratings yet
DM Module1
15 pages
Dataming T PDF
No ratings yet
Dataming T PDF
48 pages
Unit-1 Introduction To Data Mining
No ratings yet
Unit-1 Introduction To Data Mining
33 pages
Management Information System: Dr. Anand Vyas
No ratings yet
Management Information System: Dr. Anand Vyas
10 pages
ware house server
No ratings yet
ware house server
89 pages
Data Mining AND Warehousing: Abstract
No ratings yet
Data Mining AND Warehousing: Abstract
12 pages
past ppr(1)
No ratings yet
past ppr(1)
31 pages
Data Mining and Warehousing-1
No ratings yet
Data Mining and Warehousing-1
43 pages
Unit 1 Data Mining task
No ratings yet
Unit 1 Data Mining task
7 pages
BCA-404: Data Mining and Data Ware Housing
No ratings yet
BCA-404: Data Mining and Data Ware Housing
19 pages
DM Sem U-1
No ratings yet
DM Sem U-1
50 pages
Data Mining
No ratings yet
Data Mining
8 pages
Data Mining Cognate
No ratings yet
Data Mining Cognate
23 pages
Data Mining: Fundamentals and Applications
From Everand
Data Mining: Fundamentals and Applications
Fouad Sabry
No ratings yet
Tofutravel
No ratings yet
Tofutravel
31 pages
BE Presentation
No ratings yet
BE Presentation
8 pages
Kiaara Enterprises Enhancing Your Workforce
No ratings yet
Kiaara Enterprises Enhancing Your Workforce
7 pages
Business Model of JioMart
No ratings yet
Business Model of JioMart
13 pages
Droom: Leveraging Analytics in B2B and B2C Business Operations
No ratings yet
Droom: Leveraging Analytics in B2B and B2C Business Operations
9 pages
UIUC ECON 490: Applied Machine Learning in Economics
No ratings yet
UIUC ECON 490: Applied Machine Learning in Economics
28 pages
Manali Rajiv Raut: Data Scientist, Auriga AI Solutions Pvt. LTD., Nagpur
No ratings yet
Manali Rajiv Raut: Data Scientist, Auriga AI Solutions Pvt. LTD., Nagpur
3 pages
VCA-0036-15 DGD Operators Manual 1-0 PDF
No ratings yet
VCA-0036-15 DGD Operators Manual 1-0 PDF
92 pages
Ohio DC CIAM RFP Questions and Answers
No ratings yet
Ohio DC CIAM RFP Questions and Answers
3 pages
Application Onboarding Template Sample (1)
No ratings yet
Application Onboarding Template Sample (1)
49 pages
Cloud Computing BE Computer 2015 Pattern
No ratings yet
Cloud Computing BE Computer 2015 Pattern
35 pages
Hostel Management System
No ratings yet
Hostel Management System
33 pages
AWS - Best Courses Cloud
No ratings yet
AWS - Best Courses Cloud
8 pages
Event-III Java
No ratings yet
Event-III Java
15 pages
Cookie Paramount 4
No ratings yet
Cookie Paramount 4
5 pages
Syllabus Course Number: MSCD 664 Course Title: Introduction To Nosql Databases
No ratings yet
Syllabus Course Number: MSCD 664 Course Title: Introduction To Nosql Databases
6 pages
Paper Data Base
No ratings yet
Paper Data Base
8 pages
Ultimate Big Data Masters Program Curriculum v1
No ratings yet
Ultimate Big Data Masters Program Curriculum v1
14 pages
DB Project Milestone 4 (28,40,43)
No ratings yet
DB Project Milestone 4 (28,40,43)
29 pages
ISM Project
No ratings yet
ISM Project
11 pages
SQL Notes
No ratings yet
SQL Notes
58 pages
AP Invoice With Balance But Not in The List For Payment.
No ratings yet
AP Invoice With Balance But Not in The List For Payment.
2 pages
Institute of Water Modelling
No ratings yet
Institute of Water Modelling
3 pages
BASIC SQL: Schema Definition, Basic Constraints, and Queries
No ratings yet
BASIC SQL: Schema Definition, Basic Constraints, and Queries
70 pages
Creating A New Instrument in SmartPlant Enterprise - V4-0
No ratings yet
Creating A New Instrument in SmartPlant Enterprise - V4-0
60 pages
1 Stored Procedures in PL/SQL: 1.1 Oracle Users
No ratings yet
1 Stored Procedures in PL/SQL: 1.1 Oracle Users
22 pages
Dbms Lab 4th Sem 2024-25
No ratings yet
Dbms Lab 4th Sem 2024-25
54 pages
Metadata Exchange With Allfusion Erwin Data Modeler: Application Life Cycle Management
No ratings yet
Metadata Exchange With Allfusion Erwin Data Modeler: Application Life Cycle Management
43 pages
PracticeExam DataEngineerAssociate
No ratings yet
PracticeExam DataEngineerAssociate
23 pages
WebSphere ATMFRM Configuration TAFJ
No ratings yet
WebSphere ATMFRM Configuration TAFJ
20 pages
Appartment Visitor Tracking
No ratings yet
Appartment Visitor Tracking
15 pages
Important Questions
No ratings yet
Important Questions
20 pages
Dbms Session 2&3
No ratings yet
Dbms Session 2&3
13 pages