Universidade Federal do Ceará
Departamento de Engenharia de Teleinformática
Big Data:
Conceitos e Desafios
Flávio R. C. Sousa
flaviosousa@ufc.br
@flaviosousa
www.lia.ufc.br/~flavio
2015
2
Introdução
90% dos dados no mundo hoje foram
produzidos nos últimos dois anos
64 Bilhões de mensagens em 24 horas
100 GB para análise 3 seg/decisão
3
Fonte: IBM/Whatsapp
Os dados armazenados vão crescer
50 vezes mais até 2020
Introdução
 Facebook
• 1.2B de usuários
• 1,13 Trilhões de "likes"
• 240B de fotos e 140.3B de relacionamentos
• Crescimento de 7PB por mês
 Youtube
• 100 horas de vídeos adicionado a cada minuto
 Bolsa de valores de Nova Iorque
• + 1 TB de dados a cada sessão do pregão
 Boeing
• 640 TB gerados em um voo transatlântico
 Wal-Mart
• 2,5 PB e 1 milhão de transações/hora
4
5
Introdução
 LHC CERN
• 15 Petabytes por ano
 Sloan Digital Sky Survey
• 10 Petabytes gerados a cada varredura
 Google
• 24 Petabytes processados por dia
640K ought to
be enough for
anybody.
6
Introdução
Up to
10,000
Times
larger
Up to 10,000
times faster
Traditional Data
Warehouse and
Business Intelligence
DataScale
yr mo wk day hr min sec … ms s
Exa
Peta
Tera
Giga
Mega
Kilo
Decision Frequency
Occasional Frequent Real-time
Data in Motion
DataatRest
Telco Promotions
100,000 records/sec, 6B/day
10 ms/decision
270TB for Deep Analytics
Homeland Security
600,000 records/sec, 50B/day
1-2 ms/decision
320TB for Deep Analytics
Fonte: IBM
Introdução
7
2.7 ZB = 85 B x 32 GB
Os dados são “Grandes”
8
Fonte: Amplab UC Berkeley
Dados gerados por IoT
9
Os dados são “Sujos”
10
Fonte: Amplab UC Berkeley
 Diversas fontes de dados
 Sem esquema
 Sintaxe e semântica inconsistente
Questões “Complexas”
11Fonte: Amplab UC Berkeley
 Perguntas difíceis
• Qual é o impacto no trânsito e no preços das casas
com construção de uma nova ponte?
 Perguntas em tempo real
• Existe um ataque cibernético acontecendo?
 Perguntas em abertas
• Quantos supernovas aconteceram no ano passado?
Big Data
12
13
Big Data
Fonte: R. Jiménez-Peris
14
“Big Data é como sexo no colegial:
“Ninguém faz, mas todo mundo diz que faz.
Então todos pensam que alguém está
fazendo e dizem que fazem também”
Big Data
Fonte: Jay Kidd, CTO da NetApp
Big Data
 Big Data são dados que excedem o
armazenamento, o processamento e a
capacidade dos sistemas convencionais
• Volume de dados muito grande
• Dados são gerados rapidamente
• Dados não se encaixam nas estruturas de
arquiteturas de sistemas atuais
 Além disso, para obter valor a partir desses
dados, é preciso mudar a forma de
analisá-los
15
Fonte: Jordi Torres
6 V's do Big Data
Valor
Veracidade
VolatilidadeVelocidade
Variedade
Volume
Não-estruturado
Semi-estruturado
Estruturado
Terabytes
…
Exabytes
Batch
Tempo Real Janela de tempo onde
podemos usar os dados
Estado verdadeiro
da realidade
Análise Estratégica de Dados
17
Business
decisions
Analytics
Master data
management
Data access
Data
governance
Data
security
Data quality
Data
integration
Data
semantics
Fonte: Accenture
Big Data
Tecnologias para Big Data
18
Fonte: Jordi Torres
19
20
21
Fonte: IBM
Tecnologias para Big Data
22
Fonte: Jordi Torres
23
Tecnologias para Big Data
24
“O desafio fundamental para as aplicações de
Big Data é explorar os grandes volumes de
dados e extrair informações úteis ou
conhecimento para futuras ações”
Fonte: Rajaraman and Ullman 2012
Análise para Big Data
Homeland Security
FinanceSmarter Healthcare Multi-channel
sales
Telecom
Manufacturing
Traffic Control
Trading
Analytics
Fraud and
Risk
Log Analysis
Search Quality
Retail: Churn,
NBO
Análise para Big Data: Gera Valor
Fonte: Alberto Laender
Big Data: Desafios
27
Cientista de Dados
Cientista de Dados: Visão Clássica
29
Fonte: W Meira Jr.
Cientista de Dados: Visão NSA
30
Fonte: W Meira Jr.
31
Fonte: Hilary Mason
Cientista de Dados
32
Novos Sistemas para Big Data
33
Fonte: Jordi Torres
Novos Sistemas para Big Data
 Armazenamento
• SSD
 Processamento
• MapReduce
 Gerenciamento
• NoSQL, NewSQL
 Análise
• Aprendizagem de máquina
• Computação autonômica
34
Novos Sistemas para Big Data
35
Fonte: Walmart
Novos Sistemas para Big Data
 Lidem com 6 V’s do Big Data
• Heterogeneidade
• Análise de padrões temporais
• Processamento em tempo real
• Alta dimensionalidade dos dados
• Incerteza, subjetividade e ambiguidade
 Novas tecnologias
• Big Data + Cloud
 Segurança dos dados
• Privacidade
Big Data para Computação Cognitiva
37
Fonte: Jordi Torres
Big Data para Computação Cognitiva
38
Fonte: Jordi Torres
Obrigado!
Flávio R. C. Sousa
flaviosousa@ufc.br
@flaviosousa
www.lia.ufc.br/~flavio

Mais conteúdo relacionado

PPT
Big Data
PDF
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
PPTX
Big Data e Análise de Dados Massivos
PPTX
Big Data e Seus Impactos
PPTX
Big Data e NoSQL
PDF
Big Data, o que é isso?
PPTX
Big Data, JVM e Redes Sociais
PPT
Big data Instituto Big Data Brasil Crie
Big Data
Big Data - Pós Graduação Arquitetura de Nuvem - UFRN - 2014
Big Data e Análise de Dados Massivos
Big Data e Seus Impactos
Big Data e NoSQL
Big Data, o que é isso?
Big Data, JVM e Redes Sociais
Big data Instituto Big Data Brasil Crie

Mais procurados (20)

PDF
O que é BIG DATA e como pode influenciar nossas vidas
PPTX
Big data
PPT
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
ODP
Palestra Introdução a Big Data
PPTX
Big Data
PDF
Governança de Dados e Big Data
PPTX
OS CINCO Vs DO BIG DATA
PDF
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
PPTX
Era da Informação e seus impactos na empresa e sociedade
ODP
Big Data - Conceitos Básicos
PDF
PPTX
PPT
Big Data - uma visão executiva
PDF
Bigdata - Leandro Wanderley
PDF
Big Data e Data Science - Tecnologia e Mercado
PPT
O que é Data Science?
PDF
Big data e mineração de dados
PDF
Big Data Analytics - Data Science - Aplicação e Tecnologia
PDF
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
PDF
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
O que é BIG DATA e como pode influenciar nossas vidas
Big data
Big Data em 8 perguntas - 09.10.2014 - DATANORTE / GOV RN
Palestra Introdução a Big Data
Big Data
Governança de Dados e Big Data
OS CINCO Vs DO BIG DATA
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Era da Informação e seus impactos na empresa e sociedade
Big Data - Conceitos Básicos
Big Data - uma visão executiva
Bigdata - Leandro Wanderley
Big Data e Data Science - Tecnologia e Mercado
O que é Data Science?
Big data e mineração de dados
Big Data Analytics - Data Science - Aplicação e Tecnologia
Contexto de Big Data, Ciência de Dados e KDD - Pós Graduação em Big Data
Big Data Analytics - Do MapReduce ao dashboard com Hadoop e Pentaho
Anúncio

Semelhante a Big data: Conceitos e Desafios (20)

PDF
Diálogos entre cientistas de dados e cientistas sociais
PPTX
Aula BigData.pptx
PDF
Apresentacao ForumRNP 2015 - Daniela Brauner
PPTX
BIG DATA
PDF
Governança de Dados e Big Data_v02
PDF
Treinamento hadoop - dia1
PPTX
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
PPTX
Big Data
PPTX
Bigdata alexandre v2
PDF
AULA 11 - FUNDAMENTOS DE BIG DATA.pdf
PPT
BigData
PDF
aula1 - Bigdata.pdf
PDF
PDF
Qual é o futuro da estratégia de dados?
PPTX
Hackathon Inmetrics e Fiap: Desafios do Big Data
PPTX
Azure Summit 2014 - BigData com HDInsight no Azure
PDF
Palestra Big Data SCTI
PDF
Data Science, Machine Learning and Big Data
PDF
Big data - Uma visão geral da coisa...
Diálogos entre cientistas de dados e cientistas sociais
Aula BigData.pptx
Apresentacao ForumRNP 2015 - Daniela Brauner
BIG DATA
Governança de Dados e Big Data_v02
Treinamento hadoop - dia1
Aula Magna Sobre BI & BigData na UNIA, Luanda - Angola
Big Data
Bigdata alexandre v2
AULA 11 - FUNDAMENTOS DE BIG DATA.pdf
BigData
aula1 - Bigdata.pdf
Qual é o futuro da estratégia de dados?
Hackathon Inmetrics e Fiap: Desafios do Big Data
Azure Summit 2014 - BigData com HDInsight no Azure
Palestra Big Data SCTI
Data Science, Machine Learning and Big Data
Big data - Uma visão geral da coisa...
Anúncio

Último (20)

PPTX
História da enfermagem 14.07.2025_040859.pptx
PPTX
REVISA-GOIAS-6o-ANO-LP-3o-BIMESTRE-PPT.pptx
PPTX
NR 5 Treinamento completo gestão CIPA.pptx
PPTX
125511 - Aula 1 - América portuguesa antes da conquista patrimônio e preserva...
PDF
Solucões-inovadoras-para-reduzir-desigualdades-educacionais (2).pdf
PDF
Apresentação Conteúdo sepsebdbsbdbb.pptx
PPTX
DOUTRINA FORÇA TÁTICA PMRO 2022 - PPT (1).pptx
PDF
_Filosofia_-_SLIDES___questões.pdf.pptx (3).pdf
PPTX
Basic life Support - suporte tecnico de vida
PPTX
02-simulado-saeb-9o-ano-matematica1.pptx
PPTX
introdução a informatica e suas peculiaridades
PPTX
A enfermagem voltada aos adultos portadores de sindrome de down
PDF
morfologia5.pdfllllllllllllllllllllllllllll
PDF
Fronteira escrito por José de Souza Martins
PPTX
SEGURANÇA, MEIO AMBIENTE E SAÚDE Aula 1.pptx
PDF
historia-e-geografia-do-amapa.pdf slides
PPTX
Slides Lição 9, CPAD, Uma Igreja que se Arrisca, 3Tr25.pptx
PDF
SLIDES da Palestra Da Educação especial para Educação Inclusiva.pdf
PDF
Escala de Proficiência do SAEB_Escala de Proficiência do SAEB
PDF
Artigo sobre o discurso do sujeito coletivo
História da enfermagem 14.07.2025_040859.pptx
REVISA-GOIAS-6o-ANO-LP-3o-BIMESTRE-PPT.pptx
NR 5 Treinamento completo gestão CIPA.pptx
125511 - Aula 1 - América portuguesa antes da conquista patrimônio e preserva...
Solucões-inovadoras-para-reduzir-desigualdades-educacionais (2).pdf
Apresentação Conteúdo sepsebdbsbdbb.pptx
DOUTRINA FORÇA TÁTICA PMRO 2022 - PPT (1).pptx
_Filosofia_-_SLIDES___questões.pdf.pptx (3).pdf
Basic life Support - suporte tecnico de vida
02-simulado-saeb-9o-ano-matematica1.pptx
introdução a informatica e suas peculiaridades
A enfermagem voltada aos adultos portadores de sindrome de down
morfologia5.pdfllllllllllllllllllllllllllll
Fronteira escrito por José de Souza Martins
SEGURANÇA, MEIO AMBIENTE E SAÚDE Aula 1.pptx
historia-e-geografia-do-amapa.pdf slides
Slides Lição 9, CPAD, Uma Igreja que se Arrisca, 3Tr25.pptx
SLIDES da Palestra Da Educação especial para Educação Inclusiva.pdf
Escala de Proficiência do SAEB_Escala de Proficiência do SAEB
Artigo sobre o discurso do sujeito coletivo

Big data: Conceitos e Desafios

  • 1. Universidade Federal do Ceará Departamento de Engenharia de Teleinformática Big Data: Conceitos e Desafios Flávio R. C. Sousa [email protected] @flaviosousa www.lia.ufc.br/~flavio 2015
  • 2. 2
  • 3. Introdução 90% dos dados no mundo hoje foram produzidos nos últimos dois anos 64 Bilhões de mensagens em 24 horas 100 GB para análise 3 seg/decisão 3 Fonte: IBM/Whatsapp Os dados armazenados vão crescer 50 vezes mais até 2020
  • 4. Introdução  Facebook • 1.2B de usuários • 1,13 Trilhões de "likes" • 240B de fotos e 140.3B de relacionamentos • Crescimento de 7PB por mês  Youtube • 100 horas de vídeos adicionado a cada minuto  Bolsa de valores de Nova Iorque • + 1 TB de dados a cada sessão do pregão  Boeing • 640 TB gerados em um voo transatlântico  Wal-Mart • 2,5 PB e 1 milhão de transações/hora 4
  • 5. 5 Introdução  LHC CERN • 15 Petabytes por ano  Sloan Digital Sky Survey • 10 Petabytes gerados a cada varredura  Google • 24 Petabytes processados por dia 640K ought to be enough for anybody.
  • 6. 6 Introdução Up to 10,000 Times larger Up to 10,000 times faster Traditional Data Warehouse and Business Intelligence DataScale yr mo wk day hr min sec … ms s Exa Peta Tera Giga Mega Kilo Decision Frequency Occasional Frequent Real-time Data in Motion DataatRest Telco Promotions 100,000 records/sec, 6B/day 10 ms/decision 270TB for Deep Analytics Homeland Security 600,000 records/sec, 50B/day 1-2 ms/decision 320TB for Deep Analytics Fonte: IBM
  • 7. Introdução 7 2.7 ZB = 85 B x 32 GB
  • 8. Os dados são “Grandes” 8 Fonte: Amplab UC Berkeley
  • 10. Os dados são “Sujos” 10 Fonte: Amplab UC Berkeley  Diversas fontes de dados  Sem esquema  Sintaxe e semântica inconsistente
  • 11. Questões “Complexas” 11Fonte: Amplab UC Berkeley  Perguntas difíceis • Qual é o impacto no trânsito e no preços das casas com construção de uma nova ponte?  Perguntas em tempo real • Existe um ataque cibernético acontecendo?  Perguntas em abertas • Quantos supernovas aconteceram no ano passado?
  • 13. 13 Big Data Fonte: R. Jiménez-Peris
  • 14. 14 “Big Data é como sexo no colegial: “Ninguém faz, mas todo mundo diz que faz. Então todos pensam que alguém está fazendo e dizem que fazem também” Big Data Fonte: Jay Kidd, CTO da NetApp
  • 15. Big Data  Big Data são dados que excedem o armazenamento, o processamento e a capacidade dos sistemas convencionais • Volume de dados muito grande • Dados são gerados rapidamente • Dados não se encaixam nas estruturas de arquiteturas de sistemas atuais  Além disso, para obter valor a partir desses dados, é preciso mudar a forma de analisá-los 15 Fonte: Jordi Torres
  • 16. 6 V's do Big Data Valor Veracidade VolatilidadeVelocidade Variedade Volume Não-estruturado Semi-estruturado Estruturado Terabytes … Exabytes Batch Tempo Real Janela de tempo onde podemos usar os dados Estado verdadeiro da realidade Análise Estratégica de Dados
  • 17. 17 Business decisions Analytics Master data management Data access Data governance Data security Data quality Data integration Data semantics Fonte: Accenture Big Data
  • 18. Tecnologias para Big Data 18 Fonte: Jordi Torres
  • 19. 19
  • 20. 20
  • 22. Tecnologias para Big Data 22 Fonte: Jordi Torres
  • 24. 24 “O desafio fundamental para as aplicações de Big Data é explorar os grandes volumes de dados e extrair informações úteis ou conhecimento para futuras ações” Fonte: Rajaraman and Ullman 2012 Análise para Big Data
  • 25. Homeland Security FinanceSmarter Healthcare Multi-channel sales Telecom Manufacturing Traffic Control Trading Analytics Fraud and Risk Log Analysis Search Quality Retail: Churn, NBO Análise para Big Data: Gera Valor Fonte: Alberto Laender
  • 27. 27
  • 29. Cientista de Dados: Visão Clássica 29 Fonte: W Meira Jr.
  • 30. Cientista de Dados: Visão NSA 30 Fonte: W Meira Jr.
  • 33. Novos Sistemas para Big Data 33 Fonte: Jordi Torres
  • 34. Novos Sistemas para Big Data  Armazenamento • SSD  Processamento • MapReduce  Gerenciamento • NoSQL, NewSQL  Análise • Aprendizagem de máquina • Computação autonômica 34
  • 35. Novos Sistemas para Big Data 35 Fonte: Walmart
  • 36. Novos Sistemas para Big Data  Lidem com 6 V’s do Big Data • Heterogeneidade • Análise de padrões temporais • Processamento em tempo real • Alta dimensionalidade dos dados • Incerteza, subjetividade e ambiguidade  Novas tecnologias • Big Data + Cloud  Segurança dos dados • Privacidade
  • 37. Big Data para Computação Cognitiva 37 Fonte: Jordi Torres
  • 38. Big Data para Computação Cognitiva 38 Fonte: Jordi Torres
  • 39. Obrigado! Flávio R. C. Sousa [email protected] @flaviosousa www.lia.ufc.br/~flavio