0% found this document useful (0 votes)

5 views17 pages

Pipeline Presentation

Uploaded by

ravanbilalov03

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views17 pages

Pipeline Presentation

Uploaded by

ravanbilalov03

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 17

Processing Real-Time

Transaction Data
Scalable
Big Data
Pipeline
Design & Presented by:
Impleme Yusif Nuri
ntation Ravan Bilalov
Ehtesham Husain
Project Overview

REAL-TIME DATA STREAMLIT DASHBOARD DOCKERIZED

PROCESSING USING KAFKA FOR VISUALIZATION ENVIRONMENT FOR
DEPLOYMENT
Technology Stack

- APACHE KAFKA - PYTHON (KAFKA, - STREAMLIT & - DOCKER &

PANDAS, PLOTLY DOCKER COMPOSE
STREAMLIT)
- OnlineRetail.csv
dataset

- Contains real-world
Data Source retail transactions

- Used for real-time

streaming and analysis
Architecture
Overview
• Producer ➝ Kafka ➝
Consumer ➝
Dashboard
• Kafka handles real-
time data flow
• Consumer processes
data for visualization
Producer • Reads data from OnlineRetail.csv
(Kafka • Sends each row as a message to Kafka
topic: 'retail_data'

Producer)
Kafka • - Manages real-time data flow

Broker
• - Ensures data consistency and scalability
Consumer
(Kafka
Consumer)
• Listens to
'retail_data' topic
• Processes incoming
messages for
dashboard
visualization
Dashboard (Streamlit)

• - Displays real-time transaction

data
• - Key features:
• Live transaction table
• Time-Series Sales Chart
• Top Products Sold
• Sales Distribution by Country
Deployment using
Docker

• - Dockerfile: Defines Python

environment
• - docker-compose.yaml:
Manages Kafka, Producer,
Consumer, Dashboard services
\

Introduction & Prerequisites

•Objective: Securely upload and deploy files on AWS EC2.

•Requirements:
•AWS account with EC2 access
•SSH key pair (.pem
file)

•Running EC2 instance (Ubuntu/Amazon Linux)

•Docker installed locally
Setting Up EC2 & Key Pair

•Creating a Key Pair:

•Navigate to AWS Console → EC2 Dashboard
•Click Key Pairs → Create Key Pair
•Download .pem file & set permissions:
chmod 400 your-key.pem
•Launching EC2 Instance:
•Select Ubuntu or Amazon Linux AMI
•Choose instance type (e.g., t2.micro for free tier)
•Attach key pair
•Configure security groups to allow SSH (port 22)
Uploading Files via SCP

•Find EC2 Public IP:

•Go to EC2 Dashboard → Copy Public IPv4 Address
•Connect via SSH:
ssh -i your-key.pem ubuntu@your-ec2-public-ip
scp -i your-key.pem -r docker/ ubuntu@your-ec2-public-ip:~/docker-project
•-i your-key.pem: Uses SSH key
•-r docker/: Uploads the docker/ folder
•ubuntu@your-ec2-public-ip:~/docker-project: Remote destination
•Upload Files:
Deploying the Project & Next Steps

•Verify Upload:
ssh -i your-key.pem ubuntu@your-ec2-
public-ip
cd ~/docker-project
ls -l
•Install & Start Docker on EC2:
sudo apt update && sudo apt install -y
docker.io
sudo systemctl start docker
sudo systemctl enable docker
•Run Project (if using docker-compose):
cd ~/docker-project
docker-compose up -d
Challenges Faced

KAFKA CONNECTION DATA PROCESSING REAL-TIME

ISSUES OPTIMIZATIONS DASHBOARD UPDATES
Results & Insights

Successfully Live dashboard for Potential

implemented real- monitoring sales improvements for
time data pipeline trends scalability
Conclusion

- Gained experience in real-time data processing

- Future enhancements: Add machine learning

predictions for sales forecasting

Building A Real-Time E-Commerce Data Pipeline With Kafka, Flink, PostgreSQL, and Elasticsearch - by Shijun Ju - Apr, 2025 - Medium
No ratings yet
Building A Real-Time E-Commerce Data Pipeline With Kafka, Flink, PostgreSQL, and Elasticsearch - by Shijun Ju - Apr, 2025 - Medium
42 pages
CC Practical New
No ratings yet
CC Practical New
86 pages
Note
No ratings yet
Note
17 pages
Sanju Doc1
No ratings yet
Sanju Doc1
15 pages
Amazon Managed Streaming For Apache Kafka
No ratings yet
Amazon Managed Streaming For Apache Kafka
11 pages
Handson For AWS-Python
No ratings yet
Handson For AWS-Python
145 pages
Develop REST APIs with AWS API Gateway
No ratings yet
Develop REST APIs with AWS API Gateway
21 pages
Real-Time Chat App on AWS EC2 Guide
No ratings yet
Real-Time Chat App on AWS EC2 Guide
23 pages
IOT Physical Servers and Clout Offerings
No ratings yet
IOT Physical Servers and Clout Offerings
22 pages
AWS Capstone Deployment Guide Full
No ratings yet
AWS Capstone Deployment Guide Full
3 pages
Aws Project
No ratings yet
Aws Project
69 pages
Program Steps
No ratings yet
Program Steps
20 pages
Aws SRM
No ratings yet
Aws SRM
36 pages
Analytical Questions (Unit-1)
No ratings yet
Analytical Questions (Unit-1)
6 pages
Three Tier Using Docker, ECR, ECS
No ratings yet
Three Tier Using Docker, ECR, ECS
20 pages
Module 3 - Breaking The Monolith - Containers
No ratings yet
Module 3 - Breaking The Monolith - Containers
43 pages
Netflix Kafka 150325105558 Conversion Gate01
No ratings yet
Netflix Kafka 150325105558 Conversion Gate01
49 pages
AWS Dev Ops Course Content - Raj Cloud Technologies
No ratings yet
AWS Dev Ops Course Content - Raj Cloud Technologies
9 pages
TA3 Big Data Analytics
No ratings yet
TA3 Big Data Analytics
13 pages
Real Time Analytics Spark Streaming PDF
No ratings yet
Real Time Analytics Spark Streaming PDF
20 pages
AWS Advanced Networking Training
No ratings yet
AWS Advanced Networking Training
14 pages
AI Generated Test Labs
No ratings yet
AI Generated Test Labs
7 pages
All Tasks
No ratings yet
All Tasks
7 pages
AWS Course for Tech Learners
No ratings yet
AWS Course for Tech Learners
5 pages
AWS SAA Diagrams
No ratings yet
AWS SAA Diagrams
200 pages
AWS Production Readiness Guide
No ratings yet
AWS Production Readiness Guide
31 pages
Introduction To AWS DEVOPS
No ratings yet
Introduction To AWS DEVOPS
4 pages
Kafka Setup for DevOps Logging
No ratings yet
Kafka Setup for DevOps Logging
3 pages
Cloud Computing
No ratings yet
Cloud Computing
39 pages
14 - Automation Checklist
No ratings yet
14 - Automation Checklist
7 pages
AWS Document CH
No ratings yet
AWS Document CH
45 pages
Exercise 6 - AWS Elastic Container Service-1
No ratings yet
Exercise 6 - AWS Elastic Container Service-1
23 pages
Kafka
No ratings yet
Kafka
10 pages
Abhilash CC
No ratings yet
Abhilash CC
22 pages
Cloud
No ratings yet
Cloud
5 pages
Challenge Lab - Creating A Scalable and Highly Available Environment For The Café
0% (1)
Challenge Lab - Creating A Scalable and Highly Available Environment For The Café
7 pages
Student Handbook Version 5.5.0-V1.1.0
No ratings yet
Student Handbook Version 5.5.0-V1.1.0
160 pages
Apache Kafka For Real-Time Supply Chain in The Food and Retail Industry
No ratings yet
Apache Kafka For Real-Time Supply Chain in The Food and Retail Industry
64 pages
Final5 Introduction To DevOps and The Practical Use Cases at Credit OK
No ratings yet
Final5 Introduction To DevOps and The Practical Use Cases at Credit OK
68 pages
Internship Doc Final
No ratings yet
Internship Doc Final
39 pages
AWS Project by AnwarAkhtar
No ratings yet
AWS Project by AnwarAkhtar
7 pages
Ramp-Up Guide Containers
No ratings yet
Ramp-Up Guide Containers
3 pages
Course Content For AWS Cloud Training: Public Cloud: Amazon Web Services-Essentials
No ratings yet
Course Content For AWS Cloud Training: Public Cloud: Amazon Web Services-Essentials
7 pages
Unit 3 Iot II
No ratings yet
Unit 3 Iot II
12 pages
Getting Started With AWS: Analyzing Big Data
No ratings yet
Getting Started With AWS: Analyzing Big Data
29 pages
CC - Unit III - Chapter-1 & 2
No ratings yet
CC - Unit III - Chapter-1 & 2
37 pages
Ppb1 Workshop Streaming
No ratings yet
Ppb1 Workshop Streaming
64 pages
Module 4 - Challenge Lab - Creating A Dynamic Website For The Café
No ratings yet
Module 4 - Challenge Lab - Creating A Dynamic Website For The Café
15 pages
AWS Sheet - 2024
No ratings yet
AWS Sheet - 2024
11 pages
Amazon Solution Architect Associate SAA-C03 PDF
No ratings yet
Amazon Solution Architect Associate SAA-C03 PDF
5 pages
AWS Container Day A Journey To Modern App
No ratings yet
AWS Container Day A Journey To Modern App
60 pages
Deploy Flask App With AWS RDS and ElastiCache Redis
No ratings yet
Deploy Flask App With AWS RDS and ElastiCache Redis
72 pages
PRNT - AWS Services - CLFC02 - v1.0
No ratings yet
PRNT - AWS Services - CLFC02 - v1.0
5 pages
Unit 5
No ratings yet
Unit 5
10 pages
Activity - Optimize Utilization
No ratings yet
Activity - Optimize Utilization
9 pages
Devops Practice Questions
No ratings yet
Devops Practice Questions
7 pages
Real Time Analytics With Apache Kafka and Spark: Rahul Jain
100% (1)
Real Time Analytics With Apache Kafka and Spark: Rahul Jain
54 pages
AWS Solution Architect-Associate (AWSSA-C002) : Introduction
No ratings yet
AWS Solution Architect-Associate (AWSSA-C002) : Introduction
2 pages
Chapter 8
No ratings yet
Chapter 8
17 pages
NLP-Powered Recruitment Streamlining
No ratings yet
NLP-Powered Recruitment Streamlining
31 pages
Distributed Artificial Intelligence Second International Conference DAI 2020 Nanjing China October 24 27 2020 Proceedings Matthew E. Taylor
100% (8)
Distributed Artificial Intelligence Second International Conference DAI 2020 Nanjing China October 24 27 2020 Proceedings Matthew E. Taylor
69 pages
16bec0303 VL2019205005360 Pe005 PDF
No ratings yet
16bec0303 VL2019205005360 Pe005 PDF
65 pages
Hitachi Unified Compute Platform HC For VMware Interoperability Matrix
No ratings yet
Hitachi Unified Compute Platform HC For VMware Interoperability Matrix
27 pages
BSNL KL RP-02870 L2100 Final Report
No ratings yet
BSNL KL RP-02870 L2100 Final Report
22 pages
Knowledge Graph Implementation On The Wikipedia Page Using A Deep Learning Algorithm
No ratings yet
Knowledge Graph Implementation On The Wikipedia Page Using A Deep Learning Algorithm
12 pages
Cnss FW Logs Current
No ratings yet
Cnss FW Logs Current
546 pages
01 - Introduction To Data Science
No ratings yet
01 - Introduction To Data Science
77 pages
Language Test Unit 10
No ratings yet
Language Test Unit 10
2 pages
Chapter13 Installing and Updating Software Packages
No ratings yet
Chapter13 Installing and Updating Software Packages
2 pages
Notes On System Memory & Bios
No ratings yet
Notes On System Memory & Bios
9 pages
Uncertainties and Data Graphing - Assignment Excel Instructions
No ratings yet
Uncertainties and Data Graphing - Assignment Excel Instructions
16 pages
2020 Ethics-AI Routledge
No ratings yet
2020 Ethics-AI Routledge
21 pages
16 X 1 LCD - Cfah1601ayyhjp
No ratings yet
16 X 1 LCD - Cfah1601ayyhjp
74 pages
Railway
0% (1)
Railway
32 pages
Excavator Parts Reference Guide
No ratings yet
Excavator Parts Reference Guide
2 pages
Intro to Computer Science & Algorithms
No ratings yet
Intro to Computer Science & Algorithms
111 pages
BMW Engineering Automation Guide
No ratings yet
BMW Engineering Automation Guide
16 pages
RCBC Virtual MyWallet Card Terms and Conditions
No ratings yet
RCBC Virtual MyWallet Card Terms and Conditions
11 pages
Ebook Data Science in The Middle East - Original
No ratings yet
Ebook Data Science in The Middle East - Original
17 pages
Industrial Safety Gateway Guide
No ratings yet
Industrial Safety Gateway Guide
2 pages
Question1 - Questions - CSE423 Courseware - BuX - BRAC University
No ratings yet
Question1 - Questions - CSE423 Courseware - BuX - BRAC University
3 pages
0 - Course Introduction
No ratings yet
0 - Course Introduction
21 pages
CHAPTER NO 3 Class 8
No ratings yet
CHAPTER NO 3 Class 8
5 pages
Aio2023 Module1 Yolov8 Project 240523 Update
No ratings yet
Aio2023 Module1 Yolov8 Project 240523 Update
68 pages
USL Nasik Report - PDF - Malt - Brewing
No ratings yet
USL Nasik Report - PDF - Malt - Brewing
166 pages
SJX V1-50 - Walkthrough
No ratings yet
SJX V1-50 - Walkthrough
60 pages
Broadcasting Agreement For Independent Models
100% (1)
Broadcasting Agreement For Independent Models
21 pages
COD Assignment 1
No ratings yet
COD Assignment 1
3 pages
Assignment1 AMAnalysis I202001
No ratings yet
Assignment1 AMAnalysis I202001
5 pages

Pipeline Presentation

Uploaded by

Pipeline Presentation

Uploaded by

Processing Real-Time

REAL-TIME DATA STREAMLIT DASHBOARD DOCKERIZED

- APACHE KAFKA - PYTHON (KAFKA, - STREAMLIT & - DOCKER &

- Used for real-time

• - Displays real-time transaction

• - Dockerfile: Defines Python

Introduction & Prerequisites

•Objective: Securely upload and deploy files on AWS EC2.

•Running EC2 instance (Ubuntu/Amazon Linux)

•Creating a Key Pair:

•Find EC2 Public IP:

KAFKA CONNECTION DATA PROCESSING REAL-TIME

Successfully Live dashboard for Potential

- Gained experience in real-time data processing

- Future enhancements: Add machine learning

You might also like