0% found this document useful (0 votes)

27 views4 pages

Basic of Statistics

The document discusses data science concepts like data collection, analysis, and decision making. It also discusses different data science tools and techniques used in analysis like Hadoop, Hive, Scala, Spark, statistics, machine learning algorithms, and Python. The document provides steps involved in a typical data science project life cycle including data collection, exploratory data analysis, data visualization, modeling, and deployment.

Uploaded by

Debabrata Chandra

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

27 views4 pages

Basic of Statistics

Uploaded by

Debabrata Chandra

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

Introduction

07 December 2020 07:27

Career

Data Science

1. Data collection,
2. Analysis
3. Decision

Business problem

======================================================================

Airtel
Data based

20C My office

1000 GB

Big data engineers

Hadoop
Hive Data Science/Analytics
Scala collected Analysis Decision
Spark

Analysis

1. Statistics
2. Mathematics
3. Machine learning --> Model Development or Algorithm
Data preprocessing
4. Python--> language (advantage --> Packages, libraries, modules)
5. Natural Language Processing
6. Deep Learning
7. Reinforcement Learning --> A.I

GeekLurn_7.30 AM Page 1
Tableau --> business analyst

--> Deployment App, web page

1000 --> classify the people and will tell us how many people may leave the networks and NO

What could be reasons of leaving the network

500 --> Y
500 --> No

==================================================================================

Y = Mx + C ----> Straight line equation

X = 20 ---> Salary ------->

M =10 Performance (Experience, Designation, Technical skills)
C=5
Bias + 10 (Experience)
Find Y? ------> Y = 205 Salary ---> 20 + 10 (5) --> 20 + 10X is my mathematical model equation

Y = C + M(X) ===70k
20 + 10 (3) ===50k

Y = Bo + b1x1 --> model --> Y = Bo + B1x1 + B2x2 + B3x3

Y --> Salary ---> Target variable / Dependent variable / Output variable

X --> Experience --> Independent variables

Machine learning ---> Algorithm

10,000
=================================================================================

Steps involved in your project life cycle

Data can be in two types of formats

1. Structured data ---> CSV, Rows, Columns, banking, hospitals, insurances, payrolls, Retails
2. Unstructured data --> no rows, no columns ex: google search engine, what's up text, Facebook
comments,

EDA:

All columns are may not important

GeekLurn_7.30 AM Page 2
Assumptions: Follow specific assumptions.

Data visualization: Graphs, Plots, Charts ---> Business Analyst

Rows and columns --> data

Records and Variables --> Data

Y <--- Target variable/output variable/Dependent variables --> whichever I need to predict

X <-----Independent variables.

Y=X+C

Data transformations:

Standardization
Normalization
Scaling

==========================

Y = mx + C ---> Y = Bo + B1X1 + B2X2 + B3X3 + ……BnXn --> Linear Regression

Logistic Regression, Support vector machine, KNN, Naïve Bayes,

===================================================================

North -->180 --> Average Indian height--> 170

--> 160
South

===================================================================

MSE = 10,000

Avg = 1 lakh
1lakh (90k to 1,10 k) --> 1,50k

===================================================================

GeekLurn_7.30 AM Page 3
Task: Calculate the Average Indian height in 2020

When I not known exactly what is the total lot size then we will call them as
Population

Average: Sum of all values / Total sample size

in
X

Sample Population
Statistic from the variable Statistics will become parameters, it’s a constant
X bar = Average Mean = mu
Standard Deviation is 's' Standard Deviation is 'Sigma'
Finite Data Infinite data
We can calculate on data Its not always possible
whatever we will calculates are comes under Taking the instructions from D.S and apply some additional theory which provides us
"Descriptive Statistics" "Inferential Statistics"

GeekLurn_7.30 AM Page 4

SC-200: Microsoft Security Operations Analyst Preparation
From Everand
SC-200: Microsoft Security Operations Analyst Preparation
Georgio Daccache
No ratings yet
Trust The Proven Formula Ebook - 111623
No ratings yet
Trust The Proven Formula Ebook - 111623
12 pages
Company Wise Data Science Interview Questions
100% (2)
Company Wise Data Science Interview Questions
39 pages
Chapter 1 The World of Innovative Management
No ratings yet
Chapter 1 The World of Innovative Management
25 pages
Pedagogy Questions
100% (3)
Pedagogy Questions
72 pages
Data Career Skills Checklist
No ratings yet
Data Career Skills Checklist
19 pages
Article Review 11 Eng
No ratings yet
Article Review 11 Eng
18 pages
Data Science
No ratings yet
Data Science
22 pages
INSOFE-Comprehensive Curriculum On Big Data Analytics
No ratings yet
INSOFE-Comprehensive Curriculum On Big Data Analytics
11 pages
Aditya Slides For IBM
No ratings yet
Aditya Slides For IBM
125 pages
CloudyML Mega Combo Course Brochure
No ratings yet
CloudyML Mega Combo Course Brochure
19 pages
HRDF IndSF DATASCIENCE
No ratings yet
HRDF IndSF DATASCIENCE
3 pages
Data Science and Machine Learning Brochure Skillovilla
No ratings yet
Data Science and Machine Learning Brochure Skillovilla
40 pages
Advanced Certification in Data Science (213 Hours) 75,999
No ratings yet
Advanced Certification in Data Science (213 Hours) 75,999
5 pages
IDMA-1 Hero Data Science
No ratings yet
IDMA-1 Hero Data Science
19 pages
Data Science Machine Learning Brochure Skillovilla
No ratings yet
Data Science Machine Learning Brochure Skillovilla
42 pages
Machine Learning Project
67% (3)
Machine Learning Project
30 pages
Data Science Dse
No ratings yet
Data Science Dse
24 pages
Career Track Brochure - Data Science
No ratings yet
Career Track Brochure - Data Science
39 pages
Data Science
No ratings yet
Data Science
30 pages
Ba Manual Printout
No ratings yet
Ba Manual Printout
22 pages
Data Science Machine Learning Brochure Skillovilla
No ratings yet
Data Science Machine Learning Brochure Skillovilla
40 pages
Ramadan Bundle Offer All Course Module
No ratings yet
Ramadan Bundle Offer All Course Module
13 pages
Crash Course - Introduction To Data Science
No ratings yet
Crash Course - Introduction To Data Science
121 pages
PPSD 1683560645
No ratings yet
PPSD 1683560645
9 pages
Data Science Pro
No ratings yet
Data Science Pro
31 pages
Machine Learning Notes
No ratings yet
Machine Learning Notes
6 pages
110 - Data Analytics - L&E-SYS
No ratings yet
110 - Data Analytics - L&E-SYS
12 pages
Data Science Final Syllabus
No ratings yet
Data Science Final Syllabus
8 pages
BROCHURE - Data Science Learning Path - Board - Infinity
No ratings yet
BROCHURE - Data Science Learning Path - Board - Infinity
30 pages
DS Career Landscape - ACs
No ratings yet
DS Career Landscape - ACs
35 pages
Class 1 Mathematical Basis For Managerial Decision - Chapter1 - Gaurav
No ratings yet
Class 1 Mathematical Basis For Managerial Decision - Chapter1 - Gaurav
42 pages
Unit 5 (DS)
No ratings yet
Unit 5 (DS)
15 pages
Analytics Roadmap
No ratings yet
Analytics Roadmap
15 pages
Resume Building Tips by Prafful
No ratings yet
Resume Building Tips by Prafful
7 pages
A Spreadsheet Approach To Business Quantitative Methods
No ratings yet
A Spreadsheet Approach To Business Quantitative Methods
16 pages
Week 4 - Intro To ML
No ratings yet
Week 4 - Intro To ML
37 pages
Unit 1 - Exploratory Data Analysis Fundamentals
No ratings yet
Unit 1 - Exploratory Data Analysis Fundamentals
47 pages
Mini Project Report
No ratings yet
Mini Project Report
10 pages
Data Viz Case Study
No ratings yet
Data Viz Case Study
3 pages
GenAI HR
No ratings yet
GenAI HR
91 pages
Analytics 02011 Learning Path - Curriculum (6632)
No ratings yet
Analytics 02011 Learning Path - Curriculum (6632)
22 pages
Brochure
No ratings yet
Brochure
13 pages
Introduction To Analytics
No ratings yet
Introduction To Analytics
40 pages
Data Analytics Course-April
No ratings yet
Data Analytics Course-April
19 pages
Data Science and Engineering: Avg. Salary Hike
No ratings yet
Data Science and Engineering: Avg. Salary Hike
13 pages
Data Analytics Course Brochure
No ratings yet
Data Analytics Course Brochure
21 pages
Elevate Your Engineering Career With Data Science2
No ratings yet
Elevate Your Engineering Career With Data Science2
4 pages
Business Analytics Syllabus
No ratings yet
Business Analytics Syllabus
6 pages
Data Science Analytics Reviewer
No ratings yet
Data Science Analytics Reviewer
10 pages
Afaq Resume
No ratings yet
Afaq Resume
3 pages
Board Infinity - Data Science Course
No ratings yet
Board Infinity - Data Science Course
28 pages
Reviewer Math
No ratings yet
Reviewer Math
3 pages
Data Science - Ebook
No ratings yet
Data Science - Ebook
32 pages
Da Syllabus
No ratings yet
Da Syllabus
28 pages
2022ucd2164 1 2
No ratings yet
2022ucd2164 1 2
35 pages
2 Functions Intro
No ratings yet
2 Functions Intro
6 pages
Centralized 3MTT Cohort 2 Online Learning Curriculum
No ratings yet
Centralized 3MTT Cohort 2 Online Learning Curriculum
61 pages
Weka 2
No ratings yet
Weka 2
54 pages
DATA SCIENCE With DA, ML, DL, AI Using Python & R PDF
100% (1)
DATA SCIENCE With DA, ML, DL, AI Using Python & R PDF
10 pages
Data Science & AI For Freshers
No ratings yet
Data Science & AI For Freshers
26 pages
Data Science Master
No ratings yet
Data Science Master
11 pages
Data Science with R: Beginner to Expert
From Everand
Data Science with R: Beginner to Expert
Narayana Nemani
No ratings yet
Thesis Budget Sample
100% (3)
Thesis Budget Sample
4 pages
Irene Ek - EkMontagnierPersetAImeasurementInICTusageSurveys2020
No ratings yet
Irene Ek - EkMontagnierPersetAImeasurementInICTusageSurveys2020
42 pages
A Correlational Study On Embedded Cooking Skills To The Academic Performance On Cookery Program of TVL Students of Paraaque National High School 1 PDF Free
No ratings yet
A Correlational Study On Embedded Cooking Skills To The Academic Performance On Cookery Program of TVL Students of Paraaque National High School 1 PDF Free
21 pages
General Psychology Required Reading20190813 110996 103829r With Cover Page v2
No ratings yet
General Psychology Required Reading20190813 110996 103829r With Cover Page v2
324 pages
Document 3254323
No ratings yet
Document 3254323
2 pages
Multiple Choice
No ratings yet
Multiple Choice
5 pages
DLL - OCTOBER 3-7, 2022 Gen Math
No ratings yet
DLL - OCTOBER 3-7, 2022 Gen Math
4 pages
Bangor Sop
No ratings yet
Bangor Sop
3 pages
Cultural Relativism and Ethnocentrism
No ratings yet
Cultural Relativism and Ethnocentrism
13 pages
Leadership - Unit 1 Written Assignment
No ratings yet
Leadership - Unit 1 Written Assignment
5 pages
AI DS Curriculum v3 0 Green University of Bangladesh
No ratings yet
AI DS Curriculum v3 0 Green University of Bangladesh
32 pages
BACKGROUND OF THE STUDY The Licensure Examination For Teachers
No ratings yet
BACKGROUND OF THE STUDY The Licensure Examination For Teachers
3 pages
DataMining Workbook Answers
No ratings yet
DataMining Workbook Answers
18 pages
NCM103 - Activity 1 PDF
No ratings yet
NCM103 - Activity 1 PDF
2 pages
Sony Summer Internship Application Form (Your Own Resume Must Be Attached)
No ratings yet
Sony Summer Internship Application Form (Your Own Resume Must Be Attached)
1 page
Social Cultural Change
No ratings yet
Social Cultural Change
33 pages
OS LAB MANUAL - R20 Reg MLRITM
No ratings yet
OS LAB MANUAL - R20 Reg MLRITM
56 pages
EAPP - Concept Paper
100% (1)
EAPP - Concept Paper
25 pages
Quality of Work Life of Teachers: A Literature Review: Commonwealth Journal of Commerce & Management Research
No ratings yet
Quality of Work Life of Teachers: A Literature Review: Commonwealth Journal of Commerce & Management Research
26 pages
HT 100007 10 7 B E With Credits Regular June 2018 Pattern Chemical Engineering FE Sem II 1
No ratings yet
HT 100007 10 7 B E With Credits Regular June 2018 Pattern Chemical Engineering FE Sem II 1
16 pages
Technical Extracted Knec March 2025 Timetable (2.1)
No ratings yet
Technical Extracted Knec March 2025 Timetable (2.1)
17 pages
Brief Historyof ODEs
No ratings yet
Brief Historyof ODEs
6 pages
Risk Management and Safety-An Introduction
No ratings yet
Risk Management and Safety-An Introduction
169 pages
Lloyd's List Intelligence Unveils AI Risk Analysis Platform - Lloyd's List
No ratings yet
Lloyd's List Intelligence Unveils AI Risk Analysis Platform - Lloyd's List
2 pages
Analysis of Machine Learning Algorithms For
No ratings yet
Analysis of Machine Learning Algorithms For
4 pages
UCSP q2 M10
No ratings yet
UCSP q2 M10
18 pages
Approaches To Teaching Literature: Module 3
No ratings yet
Approaches To Teaching Literature: Module 3
9 pages

Basic of Statistics

Uploaded by

Basic of Statistics

Uploaded by

Introduction

07 December 2020 07:27

Big data engineers

--> Deployment App, web page

What could be reasons of leaving the network

Y = Mx + C ----> Straight line equation

X = 20 ---> Salary ------->

Y = Bo + b1x1 --> model --> Y = Bo + B1x1 + B2x2 + B3x3

Y --> Salary ---> Target variable / Dependent variable / Output variable

Machine learning ---> Algorithm

Steps involved in your project life cycle

Data can be in two types of formats

All columns are may not important

Data visualization: Graphs, Plots, Charts ---> Business Analyst

Rows and columns --> data

Records and Variables --> Data

Y <--- Target variable/output variable/Dependent variables --> whichever I need to predict

Y = mx + C ---> Y = Bo + B1X1 + B2X2 + B3X3 + ……BnXn --> Linear Regression

Logistic Regression, Support vector machine, KNN, Naïve Bayes,

North -->180 --> Average Indian height--> 170

Average: Sum of all values / Total sample size

You might also like