0% encontró este documento útil (0 votos)

14 vistas5 páginas

Preparación de Datos en Amazon

Cargado por

jtrellesyovera

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

14 vistas5 páginas

Preparación de Datos en Amazon

Cargado por

jtrellesyovera

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 5

Preparación de Datos en Amazon

En Amazon, la preparación de datos es un proceso fundamental para su modelo de negocio, el

cual depende intensamente de la optimización basada en datos para recomendaciones
personalizadas, la gestión eficiente de inventarios y la mejora continua de la experiencia de
usuario. La empresa maneja un volumen masivo de datos (Big Data) que abarca desde los
hábitos de compra de los clientes hasta la operación logística.

1. Recolección de Datos

Amazon recopila datos de múltiples fuentes que incluyen:

Interacciones del usuario: clics, búsquedas y productos agregados al carrito.

Historial de compras y preferencias de productos.

Datos de terceros: redes sociales y tendencias del mercado que aportan contexto.

Para procesar estos datos en tiempo real, Amazon utiliza Amazon Kinesis, un servicio de
streaming que permite capturar y analizar los datos masivos de manera continua, evitando
retrasos y mejorando la reactividad en sus sistemas.

2. Limpieza y Normalización de los Datos

La calidad y consistencia de los datos son cruciales en Amazon. Por eso, implementan un
riguroso proceso de limpieza que incluye:

Eliminación de duplicados y corrección de errores para asegurar datos confiables.

Completar campos vacíos y homogenizar el formato de la información.

Por ejemplo, al recolectar datos globales, puede haber variaciones en moneda (dólares, euros,
etc.), por lo cual Amazon convierte todas las cifras a una moneda estándar antes de analizarlas.
También aplican algoritmos de normalización para uniformizar los datos provenientes de
diferentes fuentes, facilitando así su análisis.

3. Almacenamiento en el Almacén de Datos

Para el almacenamiento, Amazon se apoya en su infraestructura de Amazon Web Services
(AWS), utilizando herramientas como:

Amazon S3: una solución de almacenamiento en la nube ideal para grandes volúmenes de
datos, accesible desde cualquier ubicación.

Amazon Redshift: un sistema de almacenamiento de datos que permite un análisis rápido y

efectivo, donde los equipos pueden generar reportes y observar patrones de manera ágil.

Este sistema permite a los analistas de datos acceder de forma centralizada a toda la
información necesaria para estudios y optimización de procesos.

4. Enriquecimiento de Datos

Amazon emplea algoritmos de machine learning para enriquecer y contextualizar los datos.
Estos modelos permiten anticipar patrones de comportamiento y preferencias del cliente,
agregando valor a la información.

Ejemplo: Con el modelo de "Collaborative Filtering", Amazon sugiere productos que podrían
interesarle a un cliente basándose en compras realizadas por otros usuarios con gustos
similares.

5. Visualización y Toma de Decisiones

Para tomar decisiones informadas, los datos se presentan en tableros interactivos. Con
herramientas como Amazon QuickSight, Amazon permite que sus ejecutivos y gerentes
visualicen tendencias clave de manera efectiva, facilitando la identificación de oportunidades
de negocio, como el aumento de ventas en regiones específicas o productos con mayor
demanda según la temporada.

Bibliografía Recomendada

1. [Amazon Kinesis Guía de AWS](https://aws.amazon.com/kinesis/)

2. [Amazon Redshift Almacenamiento de Datos en AWS](https://aws.amazon.com/redshift/)

3. [Cómo Amazon usa el Machine Learning AWS

Blog](https://aws.amazon.com/blogs/machinelearning/)

4. [Principios de la Preparación de Datos para Machine Learning Towards Data Science]

(https://towardsdatascience.com/datapreparationstepsinmachinelearning3d6a6a2c8c0b)
Nota:

Amazon utiliza principalmente su propia infraestructura y software de Big Data, que forman
parte de Amazon Web Services (AWS), una de las plataformas de servicios en la nube más
avanzadas y robustas a nivel mundial. AWS ofrece una serie de herramientas diseñadas para
procesar, analizar y gestionar grandes volúmenes de datos (Big Data), que permite a Amazon
optimizar sus operaciones de forma interna y ofrecer estas soluciones a otras empresas que
también necesiten trabajar con grandes cantidades de datos.

Nota:

Interbank, uno de los bancos más importantes de Perú, decidió mejorar sus servicios
ofreciendo experiencias personalizadas a sus clientes. En el 2018, el banco comenzó a trabajar
con Amazon Web Services (AWS) para implementar herramientas de análisis de datos
avanzadas. Gracias a esta tecnología, Interbank ha logrado aumentar en un 35% sus
desembolsos y reducir a la mitad el tiempo de sus procesos. Esto permite que el banco conozca
mejor a cada cliente y ofrezca soluciones más rápidas y adaptadas a sus necesidades.

https://aws.amazon.com/es/solutions/casestudies/interbankperu/

A lo largo de la exposición se han mencionado software como Amazon Kinesis, Amazon

Redshift y Amazon QuickSight, entre otros. Y es que Amazon utiliza principalmente sus propias
herramientas de Big Data para optimizar sus operaciones y personalizar la experiencia del
cliente.

1. Amazon Kinesis

Función: Plataforma de streaming en tiempo real que recopila y procesa datos en el momento
en que se generan.

Aplicación y Ejemplo: Captura interacciones en tiempo real de los usuarios, como clics y
búsquedas, permitiendo que Amazon muestre recomendaciones instantáneas basadas en el
comportamiento de navegación.

Ventaja: Ideal para recomendaciones, análisis de usuarios y detección de fraudes.

2. Amazon Redshift

Función: Almacén de datos en la nube que permite realizar análisis rápidos y complejos.
Aplicación y Ejemplo: Durante eventos de alta demanda como el Prime Day, Redshift analiza
datos históricos para anticipar las preferencias de los consumidores, optimizar inventarios y
ajustar promociones en tiempo real.

Ventaja: Su rapidez y escalabilidad permiten responder en segundos a grandes consultas.

3. Amazon S3 (Simple Storage Service)

Función: Plataforma de almacenamiento de gran capacidad en la nube.

Aplicación y Ejemplo: Guarda de forma segura y accesible datos masivos como imágenes y
reseñas de productos, permitiendo que los clientes accedan rápidamente a estos archivos
desde cualquier lugar.

Ventaja: Su alta durabilidad y disponibilidad aseguran un acceso confiable a los datos.

4. Amazon EMR (Elastic MapReduce)

Función: Herramienta de procesamiento masivo de datos que emplea frameworks como

Hadoop y Spark.

Aplicación y Ejemplo: En eventos de alta demanda como el Black Friday, Amazon usa EMR para
analizar en tiempo real los registros de actividad de los usuarios, optimizando precios y
detectando tendencias.

Ventaja: Procesa grandes volúmenes de datos de forma escalable y eficiente.

5. Amazon QuickSight

Función: Herramienta de visualización de datos en la nube que permite crear gráficos y

reportes interactivos.

Aplicación y Ejemplo: Los gerentes de Amazon utilizan QuickSight para monitorear el

rendimiento de ventas por categoría y región, ajustando las estrategias de marketing en
función de los patrones observados.

Ventaja: Facilita la interpretación de datos y una toma de decisiones más informada.

6. Amazon SageMaker

Función: Plataforma para desarrollar, entrenar y desplegar modelos de machine learning.

Aplicación y Ejemplo: SageMaker permite a Amazon predecir productos de interés para cada
cliente basándose en su historial de navegación y compras, mejorando la precisión de las
recomendaciones.

Ventaja: Automatiza y agiliza el ciclo de vida de machine learning, mejorando continuamente la

experiencia del cliente.
Estos ejemplos muestran cómo Amazon aprovecha sus propias herramientas de Big Data para
personalizar la experiencia del usuario y mejorar sus operaciones internas en momentos clave
y en la gestión diaria de sus operaciones.

También podría gustarte

Aa3 Big Data
Aún no hay calificaciones
Aa3 Big Data
19 páginas
Amazon y Big Data: Clave del Éxito
Aún no hay calificaciones
Amazon y Big Data: Clave del Éxito
3 páginas
Amazon y Big Data
Aún no hay calificaciones
Amazon y Big Data
6 páginas
Amazon y Big Data: Innovación y Crecimiento
Aún no hay calificaciones
Amazon y Big Data: Innovación y Crecimiento
19 páginas
Amazon: Big Data e Innovación
Aún no hay calificaciones
Amazon: Big Data e Innovación
4 páginas
Trabajo de Mario 4-10
Aún no hay calificaciones
Trabajo de Mario 4-10
9 páginas
Actividad 2 - Diseño de Una Bodega de Datos Vanessa
Aún no hay calificaciones
Actividad 2 - Diseño de Una Bodega de Datos Vanessa
7 páginas
Amazon
Aún no hay calificaciones
Amazon
2 páginas
Analisis Empresa Trabajo
Aún no hay calificaciones
Analisis Empresa Trabajo
2 páginas
Análisis de Datos en Amazon
Aún no hay calificaciones
Análisis de Datos en Amazon
8 páginas
Pregunta 2 Caso 29-01-22
Aún no hay calificaciones
Pregunta 2 Caso 29-01-22
2 páginas
Uso de Bases de Datos en Amazon
Aún no hay calificaciones
Uso de Bases de Datos en Amazon
14 páginas
PIA TIC Amazon
Aún no hay calificaciones
PIA TIC Amazon
15 páginas
Amazon
Aún no hay calificaciones
Amazon
3 páginas
Amazon 2
Aún no hay calificaciones
Amazon 2
4 páginas
HD Big Data
Aún no hay calificaciones
HD Big Data
8 páginas
Meta 2.3
Aún no hay calificaciones
Meta 2.3
8 páginas
Amazon: BI y Big Data en Seguridad
Aún no hay calificaciones
Amazon: BI y Big Data en Seguridad
7 páginas
Itic U2 A2 Josa
Aún no hay calificaciones
Itic U2 A2 Josa
5 páginas
Taller Amazon para Discutir en Clase
Aún no hay calificaciones
Taller Amazon para Discutir en Clase
14 páginas
N1-U1-Actividad Sumativa - Semana 2
100% (1)
N1-U1-Actividad Sumativa - Semana 2
5 páginas
Daniela Santana Amazon
Aún no hay calificaciones
Daniela Santana Amazon
5 páginas
Actividad 5inteligencia
Aún no hay calificaciones
Actividad 5inteligencia
7 páginas
Módulo: Fundamentos de Software de Gestión Semana: 2
Aún no hay calificaciones
Módulo: Fundamentos de Software de Gestión Semana: 2
8 páginas
Amazon y Big Data: Clave del Éxito
Aún no hay calificaciones
Amazon y Big Data: Clave del Éxito
1 página
La Importancia de Los Datos en Las Transformaciones Digitales Actuales PDF
Aún no hay calificaciones
La Importancia de Los Datos en Las Transformaciones Digitales Actuales PDF
6 páginas
Casos Big Data Amazon y Alibaba
Aún no hay calificaciones
Casos Big Data Amazon y Alibaba
15 páginas
Plantilla Trabajo Semana 2 Software
Aún no hay calificaciones
Plantilla Trabajo Semana 2 Software
9 páginas
Actividad de Aprendizaje 1. Casos de Éxito Que Trabajan Con Big Data
Aún no hay calificaciones
Actividad de Aprendizaje 1. Casos de Éxito Que Trabajan Con Big Data
6 páginas
Tabla, Empresas Que Utilizan Diversas Tecnologías.
Aún no hay calificaciones
Tabla, Empresas Que Utilizan Diversas Tecnologías.
2 páginas
Casos de Éxito de Big Data Empresarial
Aún no hay calificaciones
Casos de Éxito de Big Data Empresarial
10 páginas
Amazon: Transformación Digital y Big Data
Aún no hay calificaciones
Amazon: Transformación Digital y Big Data
6 páginas
Foro Semana 5
Aún no hay calificaciones
Foro Semana 5
3 páginas
Analisis de Datos para Empresas
Aún no hay calificaciones
Analisis de Datos para Empresas
15 páginas
Aa1 Big Data
Aún no hay calificaciones
Aa1 Big Data
8 páginas
Actividad 2 - EdwinOspina
Aún no hay calificaciones
Actividad 2 - EdwinOspina
9 páginas
Actividad 2 PDF
Aún no hay calificaciones
Actividad 2 PDF
11 páginas
Foda Ejemplos
Aún no hay calificaciones
Foda Ejemplos
6 páginas
Big Data Grupo 9
Aún no hay calificaciones
Big Data Grupo 9
10 páginas
10 Stories of Data Driven Success Look Book Ent ES XL
Aún no hay calificaciones
10 Stories of Data Driven Success Look Book Ent ES XL
14 páginas
Big Data: Clave Empresarial Moderna
Aún no hay calificaciones
Big Data: Clave Empresarial Moderna
3 páginas
Empresas
Aún no hay calificaciones
Empresas
1 página
Big Data - Aa1
Aún no hay calificaciones
Big Data - Aa1
13 páginas
AA1 BigData
Aún no hay calificaciones
AA1 BigData
14 páginas
Ruta Propuesta para Comenzar Con IA
Aún no hay calificaciones
Ruta Propuesta para Comenzar Con IA
7 páginas
Taller Amazon
Aún no hay calificaciones
Taller Amazon
8 páginas
Ejemplos de Big Data
Aún no hay calificaciones
Ejemplos de Big Data
5 páginas
Cuadro Comparativo Tecnologías de Big Data
Aún no hay calificaciones
Cuadro Comparativo Tecnologías de Big Data
4 páginas
Examen
Aún no hay calificaciones
Examen
14 páginas
Casos de Éxito de Big Data
Aún no hay calificaciones
Casos de Éxito de Big Data
7 páginas
Wellarchitected Analytics Lens - En.es
Aún no hay calificaciones
Wellarchitected Analytics Lens - En.es
78 páginas
Amazon Web Services
Aún no hay calificaciones
Amazon Web Services
10 páginas
Lección 4. Big Data y Arquitecturas
Aún no hay calificaciones
Lección 4. Big Data y Arquitecturas
20 páginas
Actividad 6 - Trabajo Escrito y Video Sustentación
Aún no hay calificaciones
Actividad 6 - Trabajo Escrito y Video Sustentación
15 páginas
S2-Tarea 2.1 Herramientas Que Se Utilizan para Desarrollar El Big Data Jesús Echenique
Aún no hay calificaciones
S2-Tarea 2.1 Herramientas Que Se Utilizan para Desarrollar El Big Data Jesús Echenique
5 páginas
Caso Sesión No. 4 Tendencias en Los Negocios Online - Caso de Éxito Amazon
Aún no hay calificaciones
Caso Sesión No. 4 Tendencias en Los Negocios Online - Caso de Éxito Amazon
13 páginas
Amazon Web Services
Aún no hay calificaciones
Amazon Web Services
9 páginas
Big Data Grupo 7
Aún no hay calificaciones
Big Data Grupo 7
9 páginas
Resumen Del Apunte de Curso - 10 Introducción A Machine Learning
Aún no hay calificaciones
Resumen Del Apunte de Curso - 10 Introducción A Machine Learning
5 páginas
Uso de Scikit-learn y PyTorch
Aún no hay calificaciones
Uso de Scikit-learn y PyTorch
18 páginas
COMUNICACION
Aún no hay calificaciones
COMUNICACION
7 páginas
Segmentación Con R
Aún no hay calificaciones
Segmentación Con R
6 páginas
Protocolo Aprendizaje Profundo
Aún no hay calificaciones
Protocolo Aprendizaje Profundo
5 páginas
Minería 4.0: Machine Learning en Metalurgia
Aún no hay calificaciones
Minería 4.0: Machine Learning en Metalurgia
2 páginas
Ga8 220501096 Aa2 Ev04
Aún no hay calificaciones
Ga8 220501096 Aa2 Ev04
3 páginas
Algoritmos y Derecho Son Compatibles
Aún no hay calificaciones
Algoritmos y Derecho Son Compatibles
4 páginas
Revisión de Test de Nivelación
Aún no hay calificaciones
Revisión de Test de Nivelación
99 páginas
Empresa Coca Cola Grupo 8
Aún no hay calificaciones
Empresa Coca Cola Grupo 8
27 páginas
BU+v 27+n 1+-+04+regulacion+IA
Aún no hay calificaciones
BU+v 27+n 1+-+04+regulacion+IA
9 páginas
Preparación de Datos en Amazon
Aún no hay calificaciones
Preparación de Datos en Amazon
5 páginas
Brochure Machine Learning
Aún no hay calificaciones
Brochure Machine Learning
8 páginas
Pytorch Vs Tensorflow Vs Keras - Las Diferencias Que Debes Saber
Aún no hay calificaciones
Pytorch Vs Tensorflow Vs Keras - Las Diferencias Que Debes Saber
18 páginas
Ejemplo #1.2
Aún no hay calificaciones
Ejemplo #1.2
20 páginas
Tecnologías en Prótesis Robóticas
Aún no hay calificaciones
Tecnologías en Prótesis Robóticas
15 páginas
1 IA IntroduccionALaInteligenciaArtificial
Aún no hay calificaciones
1 IA IntroduccionALaInteligenciaArtificial
53 páginas
TG - 1816 - Deteccion y Seguimiento de Personas - Montoya
Aún no hay calificaciones
TG - 1816 - Deteccion y Seguimiento de Personas - Montoya
49 páginas
Tests Ecosistema Completo
Aún no hay calificaciones
Tests Ecosistema Completo
26 páginas
Econometria
100% (1)
Econometria
23 páginas
INTELIGENCIA ARTIFICIAL - Colaborativo
Aún no hay calificaciones
INTELIGENCIA ARTIFICIAL - Colaborativo
16 páginas
Diplomado Data Science Ucayali
Aún no hay calificaciones
Diplomado Data Science Ucayali
7 páginas
Inteligencia Artificial en Tecnologia, Empresas y RRHH
Aún no hay calificaciones
Inteligencia Artificial en Tecnologia, Empresas y RRHH
27 páginas
Nodo 2 - Ejercicios
Aún no hay calificaciones
Nodo 2 - Ejercicios
4 páginas
Redes Neuronales 001
Aún no hay calificaciones
Redes Neuronales 001
5 páginas
TFG Marina Martin Moreno
Aún no hay calificaciones
TFG Marina Martin Moreno
75 páginas
Biopolitica e IA
Aún no hay calificaciones
Biopolitica e IA
5 páginas
RockingData Intro 2020
Aún no hay calificaciones
RockingData Intro 2020
38 páginas
Clasificacion ML
Aún no hay calificaciones
Clasificacion ML
5 páginas
1proyecto Sistema Inteligente en Modelos Machine Learning Final
100% (1)
1proyecto Sistema Inteligente en Modelos Machine Learning Final
32 páginas