0% found this document useful (0 votes)

138 views

Bigdata Bits

1) A resilient distributed dataset (RDD) is a read-only collection of objects partitioned across machines that can be rebuilt if lost. 2) The join operation on RDDs of type (K,V) and (K,W) returns an RDD of type (K,(V,W)) pairs with all pairs of elements for each key. 3) Both statements about RDDs are true - you can control partitioning and choose to persist RDDs to disk.

Uploaded by

Shreyansh Diwan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

138 views

Bigdata Bits

Uploaded by

Shreyansh Diwan

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

1)In spark, a ______________________is a read-only collection of objects partitioned across a

set of machines that can be rebuilt if a partition is lost.

A) Spark Streaming
B)esilient Distributed Dataset (RDD)
C) FlatMap
D) Driver

2)Given the following definition about the join transformation in Apache Spark:

def join[W](other: RDD[(K, W)]): RDD[(K, (V, W))]

Where join operation is used for joining two datasets. When it is called on datasets of type (K,
V) and (K, W), it returns a dataset of (K, (V, W)) pairs with all pairs of elements for each key.

Output the result of joinrdd, when the following code is run.

val rdd1 = sc.parallelize(Seq(("m",55),("m",56),("e",57),("e",58),("s",59),("s",54)))

val rdd2 = sc.parallelize(Seq(("m",60),("m",65),("s",61),("s",62),("h",63),("h",64)))
val joinrdd = rdd1.join(rdd2)
joinrdd.collect
1) Array[(String, (Int, Int))] = Array((m,(55,60)), (m,(55,65)), (m,(56,60)), (m,(56,65)), (s,(59,61)),
(s,(59,62)), (h,(63,64)), (s,(54,61)), (s,(54,62)))
2) Array[(String, (Int, Int))] = Array((m,(55,60)), (m,(55,65)), (m,(56,60)), (m,(56,65)), (s,(59,61)),
(s,(59,62)), (e,(57,58)), (s,(54,61)), (s,(54,62)))
3) Array[(String, (Int, Int))] = Array((m,(55,60)), (m,(55,65)), (m,(56,60)), (m,(56,65)), (s,(59,61)),
(s,(59,62)), (s,(54,61)), (s,(54,62)))
4)None of the mentioned

3)Consider the following statements in the context of Spark:

Statement 1: Spark also gives you control over how you can partition your Resilient Distributed
Datasets (RDDs)

Statement 2: Spark allows you to choose whether you want to persist Resilient Distributed
Dataset (RDD) onto disk or not.
A)Only statement 1 is true
B)Only statement 2 is true
C)Both statements are true
D)Both statements are false

4)______________ leverages Spark Core fast scheduling capability to perform streaming

analytics.
A) MLlib
B) Spark Streaming
C) GraphX
D) RDDs

5)____________________ is a distributed graph processing framework on top of Spark.

A) MLlib
B) Spark streaming
C) GraphX
D) All of the mentioned

6)Consider the following statements:

Statement 1: Scale out means grow your cluster capacity by replacing with more powerful
machines

Statement 2: Scale up means incrementally grow your cluster capacity by adding more COTS
machines (Components Off the Shelf)

A) Only statement 1 is true

B) Only statement 2 is true
C) Both statements are true
D) Both statements are false

7)Which of the following is not a NoSQL database?

A) HBase
B) SQL Server
C) Cassandra
D) None of the mentioned

8)Which of the following are the simplest NoSQL databases ?

A) Key-value
B) Wide-column
C) Document
D) All of the mentioned

9)Point out the incorrect statement in the context of Cassandra:

A) It is originally designed at Facebook
B) It is a centralized key-value store
C) It is designed to handle large amounts of data across many commodity servers, providing
high availability with no single point of failure.
D) It uses a ring-based DHT (Distributed Hash Table) but without finger tables or routing

Carbon_Credits_Through_a_Shariah_Lens_1739630381
No ratings yet
Carbon_Credits_Through_a_Shariah_Lens_1739630381
11 pages
Pyspark Dumps
No ratings yet
Pyspark Dumps
10 pages
Nptel Big Data Full Assignment Solution 2021
100% (8)
Nptel Big Data Full Assignment Solution 2021
36 pages
ACA Big Data Dumps Full
No ratings yet
ACA Big Data Dumps Full
68 pages
ACA BigData Consolidated Dump
No ratings yet
ACA BigData Consolidated Dump
29 pages
Assignment 03 BigData Computing Noc23-Cs112
No ratings yet
Assignment 03 BigData Computing Noc23-Cs112
6 pages
Week 3 Assignment Answer 2022
No ratings yet
Week 3 Assignment Answer 2022
3 pages
Week - 5
No ratings yet
Week - 5
7 pages
Week 3-1
No ratings yet
Week 3-1
8 pages
Tarea 8
0% (2)
Tarea 8
13 pages
Week 1 Assignment Answers 2022
No ratings yet
Week 1 Assignment Answers 2022
4 pages
Bigdata MCQ QA Part2
No ratings yet
Bigdata MCQ QA Part2
9 pages
Big Data QCM 1 PDF
100% (1)
Big Data QCM 1 PDF
7 pages
Spark Intreview FAQ
100% (2)
Spark Intreview FAQ
21 pages
Apache Spark - Practices
No ratings yet
Apache Spark - Practices
24 pages
Questions Certif BigData
No ratings yet
Questions Certif BigData
12 pages
DS_QCM_BigData_2021 (1)
No ratings yet
DS_QCM_BigData_2021 (1)
6 pages
BIG DATA ANALYTICS MCQs
No ratings yet
BIG DATA ANALYTICS MCQs
8 pages
Bda MCQ
100% (1)
Bda MCQ
44 pages
Apache Spark - Practices 2nd
No ratings yet
Apache Spark - Practices 2nd
26 pages
2022 Assignment Answers
No ratings yet
2022 Assignment Answers
37 pages
Bda MCQ Set
No ratings yet
Bda MCQ Set
8 pages
Quiz Assignment VIII PDF
No ratings yet
Quiz Assignment VIII PDF
3 pages
Big Data and Hadoop - Semester Exam - 6th Sem-Set 01
No ratings yet
Big Data and Hadoop - Semester Exam - 6th Sem-Set 01
3 pages
Big Data Computing - Assignment 3
No ratings yet
Big Data Computing - Assignment 3
3 pages
Spark Interview 4
No ratings yet
Spark Interview 4
10 pages
Big Data 2020
No ratings yet
Big Data 2020
13 pages
Week 0 To 8 Assignment
No ratings yet
Week 0 To 8 Assignment
31 pages
Big Data Analytics 2M Definitions
No ratings yet
Big Data Analytics 2M Definitions
3 pages
DS BigDATA 2ièmeN2TR UVT 2022 2023
No ratings yet
DS BigDATA 2ièmeN2TR UVT 2022 2023
4 pages
Nptel Assignment 1
No ratings yet
Nptel Assignment 1
4 pages
Decomposing SMACK Stack
No ratings yet
Decomposing SMACK Stack
62 pages
Bigdataqcm PDF
100% (1)
Bigdataqcm PDF
206 pages
454U8-Big Data Analytics
No ratings yet
454U8-Big Data Analytics
22 pages
Question 1: Your Answer
100% (1)
Question 1: Your Answer
26 pages
PySpark Comprehensive Notes⚡
No ratings yet
PySpark Comprehensive Notes⚡
59 pages
Test1 1617
No ratings yet
Test1 1617
4 pages
coursBUTONLYQA Merged
No ratings yet
coursBUTONLYQA Merged
52 pages
Week 8-2
No ratings yet
Week 8-2
9 pages
ABD Exame PDF
No ratings yet
ABD Exame PDF
17 pages
Devoir Surveillé: Please Answer The Following Multiple-Choice Questions
No ratings yet
Devoir Surveillé: Please Answer The Following Multiple-Choice Questions
8 pages
Apache Spark IQ
No ratings yet
Apache Spark IQ
15 pages
Spark Interview Q&A
No ratings yet
Spark Interview Q&A
31 pages
Big Data Solution Assignment-I
No ratings yet
Big Data Solution Assignment-I
4 pages
Chapter 1
No ratings yet
Chapter 1
16 pages
2023 Assignment Answers
No ratings yet
2023 Assignment Answers
52 pages
Assignment1 BigData Computing Noc23-Cs112
No ratings yet
Assignment1 BigData Computing Noc23-Cs112
8 pages
Big Data Analytics
No ratings yet
Big Data Analytics
6 pages
Apache Spark Interview Questions
No ratings yet
Apache Spark Interview Questions
12 pages
Assignment 7solution
No ratings yet
Assignment 7solution
4 pages
Spark Interview Questions
No ratings yet
Spark Interview Questions
19 pages
Final MCQ DT
No ratings yet
Final MCQ DT
176 pages
w 7 Assignment
No ratings yet
w 7 Assignment
2 pages
NoSQL Model Question (2)
No ratings yet
NoSQL Model Question (2)
7 pages
PracticeExam DCADAS3 Scala 1
No ratings yet
PracticeExam DCADAS3 Scala 1
27 pages
NoSQL - Database Revolution Q&A
50% (6)
NoSQL - Database Revolution Q&A
4 pages
CSE545 sp20 (4) 2-25
No ratings yet
CSE545 sp20 (4) 2-25
58 pages
Couchbase Certified Java Developer - Exam Practice Tests
From Everand
Couchbase Certified Java Developer - Exam Practice Tests
Cristian Scutaru
No ratings yet
Administering Microsoft Azure SQL Solutions DP 300
From Everand
Administering Microsoft Azure SQL Solutions DP 300
Manish Soni
No ratings yet
Lisp Programming Language
From Everand
Lisp Programming Language
Faiz ul haque Zeya
No ratings yet
R Fast Track Guide - 86 Key Points Every Programmer from Other Languages Should Master
From Everand
R Fast Track Guide - 86 Key Points Every Programmer from Other Languages Should Master
Ginno
No ratings yet
Ghatna Chakra Book For SSC in Hindi PDF
No ratings yet
Ghatna Chakra Book For SSC in Hindi PDF
784 pages
Company Interview Questions
No ratings yet
Company Interview Questions
6 pages
Handling Data Skew in Mapreduce: Benjamin Gufler, Nikolaus Augsten, Angelika Reiser and Alfons Kemper
No ratings yet
Handling Data Skew in Mapreduce: Benjamin Gufler, Nikolaus Augsten, Angelika Reiser and Alfons Kemper
10 pages
The New India Assurance Co. LTD.: Leehan Retails PVT LTD
No ratings yet
The New India Assurance Co. LTD.: Leehan Retails PVT LTD
4 pages
Chevrolet Lottery Board: Po Box 200, Harrogate England, United Kingdom
No ratings yet
Chevrolet Lottery Board: Po Box 200, Harrogate England, United Kingdom
2 pages
Wipro Very Important-1
75% (4)
Wipro Very Important-1
310 pages
HBase Interview Questions
No ratings yet
HBase Interview Questions
12 pages
Bigdata Bits PDF
No ratings yet
Bigdata Bits PDF
2 pages
Presentation Skills Flyer 20-Aug
No ratings yet
Presentation Skills Flyer 20-Aug
1 page
731409833-NASSCOM-10000-Start-ups-link
No ratings yet
731409833-NASSCOM-10000-Start-ups-link
42 pages
Genetic Engineering: Presented By: Kouki Safa KHALFA Youssef Hizawi Maram Nsiri Hamza Barbar Mede
No ratings yet
Genetic Engineering: Presented By: Kouki Safa KHALFA Youssef Hizawi Maram Nsiri Hamza Barbar Mede
6 pages
Contents:: Checking Uwe Viper 2000 Axial 100
100% (1)
Contents:: Checking Uwe Viper 2000 Axial 100
9 pages
TMP0001 ThermaSeam Brochure
No ratings yet
TMP0001 ThermaSeam Brochure
4 pages
IZYLUM_LT_ProductSheet_EN
No ratings yet
IZYLUM_LT_ProductSheet_EN
30 pages
In Re: Magic Restaurants, Inc. Magic American Cafe, Inc., Debtors Magic Restaurants, Inc. Magic American Cafe, Inc. v. Bowie Produce Co., Inc., Patricia A. Staiano, Trustee, 205 F.3d 108, 3rd Cir. (2000)
No ratings yet
In Re: Magic Restaurants, Inc. Magic American Cafe, Inc., Debtors Magic Restaurants, Inc. Magic American Cafe, Inc. v. Bowie Produce Co., Inc., Patricia A. Staiano, Trustee, 205 F.3d 108, 3rd Cir. (2000)
14 pages
9-25-19 - A Case Study of Impacts of Flooding in Espana Boulevard, Sampaloc District City of Manila
No ratings yet
9-25-19 - A Case Study of Impacts of Flooding in Espana Boulevard, Sampaloc District City of Manila
78 pages
CPH As Fertilizer
No ratings yet
CPH As Fertilizer
3 pages
Chapter 3
100% (1)
Chapter 3
12 pages
Baker Surge Testing Electric Motors WP
No ratings yet
Baker Surge Testing Electric Motors WP
8 pages
Dante For DLive Iss
No ratings yet
Dante For DLive Iss
10 pages
Construction Cost Handbook India 2016
No ratings yet
Construction Cost Handbook India 2016
120 pages
BAGAD
100% (8)
BAGAD
5 pages
Design Analysis of A Mechanical Rice Transplanter
No ratings yet
Design Analysis of A Mechanical Rice Transplanter
7 pages
Bls Study Guide
No ratings yet
Bls Study Guide
2 pages
Annual Report 2018 (English)
No ratings yet
Annual Report 2018 (English)
78 pages
Touch The Sky - Chord Chart PDF
No ratings yet
Touch The Sky - Chord Chart PDF
1 page
TSL - BEMS - 2023 - 000003 Discontinued Philips Respironics BiPAP A30 - A40 (1st Generation)
No ratings yet
TSL - BEMS - 2023 - 000003 Discontinued Philips Respironics BiPAP A30 - A40 (1st Generation)
2 pages
Miciano vs. Brimo
No ratings yet
Miciano vs. Brimo
2 pages
Reedited Thesis
No ratings yet
Reedited Thesis
55 pages
Indian Labour Laws in Construction
No ratings yet
Indian Labour Laws in Construction
7 pages
Customer Statement 2
No ratings yet
Customer Statement 2
4 pages
Fortigate Security - Cours-3
No ratings yet
Fortigate Security - Cours-3
100 pages
United Muslim and Christian Urban Poor Association, Inc. V Bryc
No ratings yet
United Muslim and Christian Urban Poor Association, Inc. V Bryc
3 pages
4 Issue 6 Intl JLMGMT Human 395
No ratings yet
4 Issue 6 Intl JLMGMT Human 395
12 pages
Methylphenidate Final
100% (1)
Methylphenidate Final
3 pages
Writing Power Intent For A Design
No ratings yet
Writing Power Intent For A Design
3 pages

Bigdata Bits

Uploaded by

Bigdata Bits

Uploaded by

1)In spark, a ______________________is a read-only collection of objects partitioned across a

set of machines that can be rebuilt if a partition is lost.

def join[W](other: RDD[(K, W)]): RDD[(K, (V, W))]

Output the result of joinrdd, when the following code is run.

val rdd1 = sc.parallelize(Seq(("m",55),("m",56),("e",57),("e",58),("s",59),("s",54)))

3)Consider the following statements in the context of Spark:

4)______________ leverages Spark Core fast scheduling capability to perform streaming

5)____________________ is a distributed graph processing framework on top of Spark.

6)Consider the following statements:

A) Only statement 1 is true

7)Which of the following is not a NoSQL database?

8)Which of the following are the simplest NoSQL databases ?

9)Point out the incorrect statement in the context of Cassandra:

You might also like