Cassandra Data Model Big Data Seminar

Apache Cassandra is a distributed NoSQL database designed for handling large datasets with high availability and no single point of failure. It utilizes a wide-column store model organized into keyspaces and tables, allowing for dynamic column addition and efficient data modeling. Cassandra is particularly beneficial for big data analytics due to its scalability, high write throughput, and fault-tolerant architecture.

Uploaded by

msroshni232006

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

210 views8 pages

Cassandra Data Model Big Data Seminar

Uploaded by

msroshni232006

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

Seminar

Regno:611723104085
Name:roshni m s.
Subject:Big data
analytics
Introduction to Cassandra
• • Apache Cassandra is a distributed NoSQL
database.
• • Designed to handle large amounts of data
across many servers.
• • Provides high availability with no single point
of failure.
• • Suitable for big data applications.
Cassandra Data Model Overview
• • Cassandra uses a wide-column store model.
• • Data is organized into keyspaces and tables.
• • Tables consist of rows identified by a primary
key.
• • Columns within a row can be added
dynamically.
Key Data Modeling Concepts
• • Keyspace: Top-level namespace that defines
replication.
• • Table: Structure that holds data with defined
schema.
• • Partition Key: Determines data distribution
across nodes.
• • Clustering Columns: Define data sorting
within partitions.
• • Primary Key = Partition Key + Clustering
Columns.
Example: Student Table
• CREATE TABLE student (
• student_id UUID PRIMARY KEY,
• name TEXT,
• age INT,
• department TEXT
• );

• • Each student has a unique student_id.

• • Data is partitioned by student_id.
Example: Composite Primary Key
• CREATE TABLE marks (
• student_id UUID,
• subject TEXT,
• score INT,
• PRIMARY KEY (student_id, subject)
• );

• • Partitioned by student_id, clustered by

subject.
Benefits for Big Data Analytics
• • Scalable architecture suitable for growing
datasets.
• • High write throughput and low latency
reads.
• • Ideal for real-time analytics applications.
• • Fault-tolerant and distributed by design.
Conclusion
• • Cassandra is a powerful NoSQL database for
big data.
• • Its data model supports flexible and efficient
storage.
• • Widely used in industries requiring
scalability and speed.
• • Ideal choice for Big Data Analytics solutions.

Wide-Column Stores: Big Data Management Phil Bartie
No ratings yet
Wide-Column Stores: Big Data Management Phil Bartie
46 pages
Gheribchaimal 2 Repport 2
No ratings yet
Gheribchaimal 2 Repport 2
5 pages
1.5 Module-1
No ratings yet
1.5 Module-1
21 pages
Dzone Refcard 153 Apache Cassandra 2020
No ratings yet
Dzone Refcard 153 Apache Cassandra 2020
11 pages
Chapter 7
No ratings yet
Chapter 7
48 pages
Iccmc51019 2021 9418441
No ratings yet
Iccmc51019 2021 9418441
5 pages
Big Data Tech: NoSQL & Hadoop
No ratings yet
Big Data Tech: NoSQL & Hadoop
16 pages
Facebook's Apache Cassandra Overview
No ratings yet
Facebook's Apache Cassandra Overview
23 pages
Column-Oriented NoSQL Databases Explained
No ratings yet
Column-Oriented NoSQL Databases Explained
22 pages
Big Data Analytics Course Guide
No ratings yet
Big Data Analytics Course Guide
71 pages
CloudComputing DATABASE
No ratings yet
CloudComputing DATABASE
27 pages
Intro To Cassandra For Developers
No ratings yet
Intro To Cassandra For Developers
61 pages
Slide 6 NoSQL Database and HBase Tutorial
No ratings yet
Slide 6 NoSQL Database and HBase Tutorial
110 pages
Intro To NoSQL
No ratings yet
Intro To NoSQL
18 pages
Lecture 3 - Introduction To NoSQL - Updated
No ratings yet
Lecture 3 - Introduction To NoSQL - Updated
35 pages
Cassandra Complete Notes
No ratings yet
Cassandra Complete Notes
5 pages
Module - 3
No ratings yet
Module - 3
63 pages
Mod10-Wk10 CSG2132 Module 10 Big Data 2020
No ratings yet
Mod10-Wk10 CSG2132 Module 10 Big Data 2020
26 pages
Chapter-1-Introduction To Big Data
No ratings yet
Chapter-1-Introduction To Big Data
25 pages
Cassandra Notes
No ratings yet
Cassandra Notes
50 pages
Unit 2 - Session 1 and 2
No ratings yet
Unit 2 - Session 1 and 2
25 pages
BD Unit 4
No ratings yet
BD Unit 4
45 pages
Lab Exam Notes
No ratings yet
Lab Exam Notes
3 pages
Lecture 6 - NoSQL
No ratings yet
Lecture 6 - NoSQL
28 pages
Unit 1 Mangodb
No ratings yet
Unit 1 Mangodb
57 pages
SQL Server Key-Value Store Insights
No ratings yet
SQL Server Key-Value Store Insights
109 pages
Zkbjzovkse Vkesz
No ratings yet
Zkbjzovkse Vkesz
8 pages
Seminar Topic Nosql
No ratings yet
Seminar Topic Nosql
73 pages
Module 1
No ratings yet
Module 1
34 pages
MongoDB Shopping Cart Schema Guide
No ratings yet
MongoDB Shopping Cart Schema Guide
40 pages
BDA Unit-2
No ratings yet
BDA Unit-2
30 pages
Cassandra Notes
No ratings yet
Cassandra Notes
45 pages
03 Unit Bda Hadoop, Map Reduce
No ratings yet
03 Unit Bda Hadoop, Map Reduce
80 pages
Course Code: CCS334 Course Name: Big Data Analytics Regulation: 2021 Year/Sem: Iii / Vi Faculty Incharge
No ratings yet
Course Code: CCS334 Course Name: Big Data Analytics Regulation: 2021 Year/Sem: Iii / Vi Faculty Incharge
12 pages
9 TH
No ratings yet
9 TH
33 pages
SS1123 - D2T - Apache Cassandra Overview PDF
100% (1)
SS1123 - D2T - Apache Cassandra Overview PDF
45 pages
Pcadmmin,+1451591946 ICITDCEME-15
No ratings yet
Pcadmmin,+1451591946 ICITDCEME-15
4 pages
2: Data Model: Creating An E Cient Data Model For Highly-Loaded Applications
No ratings yet
2: Data Model: Creating An E Cient Data Model For Highly-Loaded Applications
83 pages
Understanding NoSQL Databases
No ratings yet
Understanding NoSQL Databases
31 pages
Big Data Unit 5
No ratings yet
Big Data Unit 5
16 pages
Big Data Analytics: NoSQL & Hadoop Overview
No ratings yet
Big Data Analytics: NoSQL & Hadoop Overview
55 pages
Cassandra
No ratings yet
Cassandra
7 pages
Big Data Analytics Unit-1
No ratings yet
Big Data Analytics Unit-1
39 pages
Unit 2
No ratings yet
Unit 2
26 pages
4.big Data Technology Landscape
No ratings yet
4.big Data Technology Landscape
31 pages
TR Bigdata 05 2015 CKL
No ratings yet
TR Bigdata 05 2015 CKL
8 pages
Cassandra Data Modeling Guide
No ratings yet
Cassandra Data Modeling Guide
8 pages
Cassandra
No ratings yet
Cassandra
31 pages
Overview of Apache Cassandra Database
No ratings yet
Overview of Apache Cassandra Database
10 pages
Graph Databases: Key Points: 1. Definition & Basics
No ratings yet
Graph Databases: Key Points: 1. Definition & Basics
20 pages
Cassandra Design Patterns Overview
No ratings yet
Cassandra Design Patterns Overview
32 pages
Slides PDF - Module 3
No ratings yet
Slides PDF - Module 3
82 pages
ArangoDB Performance Tuning Guide
No ratings yet
ArangoDB Performance Tuning Guide
4 pages
Cassandra Quick Guide
No ratings yet
Cassandra Quick Guide
60 pages
Unit V Big Data Frameworks
No ratings yet
Unit V Big Data Frameworks
42 pages
Storing Data with Hadoop and Hive
No ratings yet
Storing Data with Hadoop and Hive
16 pages
Plaug 4
No ratings yet
Plaug 4
2 pages
Virtualization Structures in Cloud Computing
No ratings yet
Virtualization Structures in Cloud Computing
8 pages
Global State of Distributed System Presentation
No ratings yet
Global State of Distributed System Presentation
12 pages
Distributed Computation Model Seminar
No ratings yet
Distributed Computation Model Seminar
6 pages
Decrypt Caesar Cipher Case Study
No ratings yet
Decrypt Caesar Cipher Case Study
13 pages

Cassandra Data Model Big Data Seminar

Uploaded by

Cassandra Data Model Big Data Seminar

Uploaded by

Seminar

• • Each student has a unique student_id.

• • Partitioned by student_id, clustered by

You might also like