0% encontró este documento útil (0 votos)
9 vistas12 páginas

Big Data

El Big Data se refiere al gran volumen de datos estructurados y no estructurados que las organizaciones utilizan para mejorar la toma de decisiones y optimizar procesos. Requiere tecnologías avanzadas como cloud, machine learning e IA para extraer su valor, y se gestiona a través de Data Warehouses y Data Lakes. Las características clave del Big Data incluyen volumen, variedad, velocidad y veracidad, que son esenciales para el análisis efectivo de los datos.

Cargado por

saliacamara
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
9 vistas12 páginas

Big Data

El Big Data se refiere al gran volumen de datos estructurados y no estructurados que las organizaciones utilizan para mejorar la toma de decisiones y optimizar procesos. Requiere tecnologías avanzadas como cloud, machine learning e IA para extraer su valor, y se gestiona a través de Data Warehouses y Data Lakes. Las características clave del Big Data incluyen volumen, variedad, velocidad y veracidad, que son esenciales para el análisis efectivo de los datos.

Cargado por

saliacamara
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 12

BIG DATA

UOSENI Y AMINE
ÍNDICE
¿QUÉ ES EL BIG DATA?
Big data es un término que describe
el gran volumen de datos
estructurados y no estructurados
que inundan una empresa todos los
días. Pero no es la cantidad de datos
lo importante. Lo que importa es lo
que las organizaciones hacen con los
datos.
El Big Data también son
datos masivos que
requieren tecnologías
avanzadas para extraer su
valor como el cloud,el
machine learning o la IA
¿PARA QUE SIRVE EL BIG
DATA?

El Big Data permite extraer información


útil para diversos fines, como mejorar la
toma de decisiones, optimizar procesos,
innovar productos, personalizar servicios,
predecir tendencias, etc.
INFRAESRUCTURA
¿DÓNDE PROCESAR LOS DATOS?
Los datos del Big Data se mueven en el Data Warehouse y que
luego llegan al Data Lake.
Los datos almacenados en un Data Warehouse, que son los que
están estructurados y que se utilizan para su análisis y para la
generación de informes.
Luego los Data Lake son los que almacenan los datos de
distintas fuentes, multiestructurados y se mantiene en su
formato original hasta que se decide que van a ser utilizados
para la consecución de algún fin.
ALMACENAMIENTO
¿CÓMO ORGANIZA LOS DATOS EL BIG DATA?
Los datos del big data se encuentran en muchos
lugares diferentes, ya que son generados por una
amplia variedad de dispositivos y sistemas en todo
el mundo. Estos datos pueden estar almacenados en
servidores y centros de datos en todo el mundo, y se
pueden acceder a ellos a través de la red.
PROCESAMIENTO
¿CÓMO TRABAJA EL BIG DATA CON LOS DATOS??
El Big Data implica el aprovechamiento
de gran cantidad de datos no
estructurados, estructurados y semi
estructurados recolectados de diversas
fuentes. Dichos datos son analizados
utilizando Machine Learning y otras
técnicas avanzadas, con la finalidad de
obtener información valiosa para la
toma de decisiones.
ANÁLISIS
¿QUÉ HACE EL BIG DATA CON LOS DATOS?
Obtencion de datos Proceso de datos
También hay otra cosa que En esta etapa se organiza la información
tener en cuenta: el lugar en el recolectada para que su análisis pueda ser más
que se almacenan, que en eficiente. Existen herramientas que se encargan
algunas ocasiones significa de la gestión de esta tarea, ya que intentar
tener más de un servidor a procesar los datos mientras siguen llegando se
convierte en un reto más allá de las posibilidades
disposición, ya sea físico o en la
humanas.
nube.
Limpieza de datos Análisis de datos
Para garantizar que se cuenta con datos Existen diferentes maneras de analizar
valiosos es necesario clasificarlos, el Big Data con herramientas
etiquetarlos y jerarquizarlos de acuerdo tecnológicas que son capaces de
con las necesidades y objetivos de la procesar estas cantidades de
organización. De esta manera, se vuelve información. Por ejemplo:
más sencilla la decisión de eliminar, lo
Machine learning
que impide que se duplique o se tome
Minería de datos
toda la información que viene de fuentes
Analíticas predictivas
dudosas.
Minería de textos
Las 4 V en el Big Data
El big data implica un volumen enorme de datos. En un inicio los datos eran
Volumen creados por los propios empleados pero ahora que los datos son generados
automáticamente por máquinas, redes e interacciones personales en sistemas
como redes sociales los volúmenes a analizar son masivos.

La variedad se refiere a las diferentes fuentes y tipos de datos tanto estructurados


Variedad como no estructurados. Hace pocos años los únicos datos que se almacenaban eran
de fuentes como hojas de cálculo y bases de datos. Ahora, los datos llegan en la
forma de emails, fotos, videos, sistemas de monitorización, PDFs, ficheros de sonido

La velocidad en big data se refiere al ritmo en que los datos de entrada fluyen desde
Velocidad las diversas fuentes como procesos de negocio, máquinas y sensores, redes sociales,
dispositivos móviles, etc. El flujo de datos es masivo y continuo.

La veracidad en el big Data Veracity se refiere al sesgo, el ruido y la alteración de datos. Los
Veracidad responsables del proyecto big data han de preguntarse honestamente si los datos que se
almacenan y extraen son directamente relacionados y significativos al problema que se trata de
analizar
WEBGRAFÍA

También podría gustarte