0% encontró este documento útil (0 votos)
14 vistas5 páginas

Preparación de Datos en Amazon

Cargado por

jtrellesyovera
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
14 vistas5 páginas

Preparación de Datos en Amazon

Cargado por

jtrellesyovera
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 5

Preparación de Datos en Amazon

En Amazon, la preparación de datos es un proceso fundamental para su modelo de negocio, el


cual depende intensamente de la optimización basada en datos para recomendaciones
personalizadas, la gestión eficiente de inventarios y la mejora continua de la experiencia de
usuario. La empresa maneja un volumen masivo de datos (Big Data) que abarca desde los
hábitos de compra de los clientes hasta la operación logística.

1. Recolección de Datos

Amazon recopila datos de múltiples fuentes que incluyen:

Interacciones del usuario: clics, búsquedas y productos agregados al carrito.

Historial de compras y preferencias de productos.

Datos de terceros: redes sociales y tendencias del mercado que aportan contexto.

Para procesar estos datos en tiempo real, Amazon utiliza Amazon Kinesis, un servicio de
streaming que permite capturar y analizar los datos masivos de manera continua, evitando
retrasos y mejorando la reactividad en sus sistemas.

2. Limpieza y Normalización de los Datos

La calidad y consistencia de los datos son cruciales en Amazon. Por eso, implementan un
riguroso proceso de limpieza que incluye:

Eliminación de duplicados y corrección de errores para asegurar datos confiables.

Completar campos vacíos y homogenizar el formato de la información.

Por ejemplo, al recolectar datos globales, puede haber variaciones en moneda (dólares, euros,
etc.), por lo cual Amazon convierte todas las cifras a una moneda estándar antes de analizarlas.
También aplican algoritmos de normalización para uniformizar los datos provenientes de
diferentes fuentes, facilitando así su análisis.

3. Almacenamiento en el Almacén de Datos


Para el almacenamiento, Amazon se apoya en su infraestructura de Amazon Web Services
(AWS), utilizando herramientas como:

Amazon S3: una solución de almacenamiento en la nube ideal para grandes volúmenes de
datos, accesible desde cualquier ubicación.

Amazon Redshift: un sistema de almacenamiento de datos que permite un análisis rápido y


efectivo, donde los equipos pueden generar reportes y observar patrones de manera ágil.

Este sistema permite a los analistas de datos acceder de forma centralizada a toda la
información necesaria para estudios y optimización de procesos.

4. Enriquecimiento de Datos

Amazon emplea algoritmos de machine learning para enriquecer y contextualizar los datos.
Estos modelos permiten anticipar patrones de comportamiento y preferencias del cliente,
agregando valor a la información.

Ejemplo: Con el modelo de "Collaborative Filtering", Amazon sugiere productos que podrían
interesarle a un cliente basándose en compras realizadas por otros usuarios con gustos
similares.

5. Visualización y Toma de Decisiones

Para tomar decisiones informadas, los datos se presentan en tableros interactivos. Con
herramientas como Amazon QuickSight, Amazon permite que sus ejecutivos y gerentes
visualicen tendencias clave de manera efectiva, facilitando la identificación de oportunidades
de negocio, como el aumento de ventas en regiones específicas o productos con mayor
demanda según la temporada.

Bibliografía Recomendada

1. [Amazon Kinesis Guía de AWS](https://aws.amazon.com/kinesis/)

2. [Amazon Redshift Almacenamiento de Datos en AWS](https://aws.amazon.com/redshift/)

3. [Cómo Amazon usa el Machine Learning AWS


Blog](https://aws.amazon.com/blogs/machinelearning/)

4. [Principios de la Preparación de Datos para Machine Learning Towards Data Science]


(https://towardsdatascience.com/datapreparationstepsinmachinelearning3d6a6a2c8c0b)
Nota:

Amazon utiliza principalmente su propia infraestructura y software de Big Data, que forman
parte de Amazon Web Services (AWS), una de las plataformas de servicios en la nube más
avanzadas y robustas a nivel mundial. AWS ofrece una serie de herramientas diseñadas para
procesar, analizar y gestionar grandes volúmenes de datos (Big Data), que permite a Amazon
optimizar sus operaciones de forma interna y ofrecer estas soluciones a otras empresas que
también necesiten trabajar con grandes cantidades de datos.

Nota:

Interbank, uno de los bancos más importantes de Perú, decidió mejorar sus servicios
ofreciendo experiencias personalizadas a sus clientes. En el 2018, el banco comenzó a trabajar
con Amazon Web Services (AWS) para implementar herramientas de análisis de datos
avanzadas. Gracias a esta tecnología, Interbank ha logrado aumentar en un 35% sus
desembolsos y reducir a la mitad el tiempo de sus procesos. Esto permite que el banco conozca
mejor a cada cliente y ofrezca soluciones más rápidas y adaptadas a sus necesidades.

https://aws.amazon.com/es/solutions/casestudies/interbankperu/

A lo largo de la exposición se han mencionado software como Amazon Kinesis, Amazon


Redshift y Amazon QuickSight, entre otros. Y es que Amazon utiliza principalmente sus propias
herramientas de Big Data para optimizar sus operaciones y personalizar la experiencia del
cliente.

1. Amazon Kinesis

Función: Plataforma de streaming en tiempo real que recopila y procesa datos en el momento
en que se generan.

Aplicación y Ejemplo: Captura interacciones en tiempo real de los usuarios, como clics y
búsquedas, permitiendo que Amazon muestre recomendaciones instantáneas basadas en el
comportamiento de navegación.

Ventaja: Ideal para recomendaciones, análisis de usuarios y detección de fraudes.

2. Amazon Redshift

Función: Almacén de datos en la nube que permite realizar análisis rápidos y complejos.
Aplicación y Ejemplo: Durante eventos de alta demanda como el Prime Day, Redshift analiza
datos históricos para anticipar las preferencias de los consumidores, optimizar inventarios y
ajustar promociones en tiempo real.

Ventaja: Su rapidez y escalabilidad permiten responder en segundos a grandes consultas.

3. Amazon S3 (Simple Storage Service)

Función: Plataforma de almacenamiento de gran capacidad en la nube.

Aplicación y Ejemplo: Guarda de forma segura y accesible datos masivos como imágenes y
reseñas de productos, permitiendo que los clientes accedan rápidamente a estos archivos
desde cualquier lugar.

Ventaja: Su alta durabilidad y disponibilidad aseguran un acceso confiable a los datos.

4. Amazon EMR (Elastic MapReduce)

Función: Herramienta de procesamiento masivo de datos que emplea frameworks como


Hadoop y Spark.

Aplicación y Ejemplo: En eventos de alta demanda como el Black Friday, Amazon usa EMR para
analizar en tiempo real los registros de actividad de los usuarios, optimizando precios y
detectando tendencias.

Ventaja: Procesa grandes volúmenes de datos de forma escalable y eficiente.

5. Amazon QuickSight

Función: Herramienta de visualización de datos en la nube que permite crear gráficos y


reportes interactivos.

Aplicación y Ejemplo: Los gerentes de Amazon utilizan QuickSight para monitorear el


rendimiento de ventas por categoría y región, ajustando las estrategias de marketing en
función de los patrones observados.

Ventaja: Facilita la interpretación de datos y una toma de decisiones más informada.

6. Amazon SageMaker

Función: Plataforma para desarrollar, entrenar y desplegar modelos de machine learning.

Aplicación y Ejemplo: SageMaker permite a Amazon predecir productos de interés para cada
cliente basándose en su historial de navegación y compras, mejorando la precisión de las
recomendaciones.

Ventaja: Automatiza y agiliza el ciclo de vida de machine learning, mejorando continuamente la


experiencia del cliente.
Estos ejemplos muestran cómo Amazon aprovecha sus propias herramientas de Big Data para
personalizar la experiencia del usuario y mejorar sus operaciones internas en momentos clave
y en la gestión diaria de sus operaciones.

También podría gustarte