0% encontró este documento útil (0 votos)
341 vistas5 páginas

Bases de Datos Distribuidas en Empresas

El documento describe los sistemas de bases de datos distribuidas de Amazon y Netflix. Amazon utiliza Amazon Aurora, que replica datos en múltiples zonas de disponibilidad dentro de AWS. Netflix usa Apache Cassandra, que distribuye datos a través de múltiples nodos para admitir recomendaciones personalizadas y contenido a gran escala. Ambas compañías requieren soluciones escalables para manejar grandes volúmenes de datos de manera confiable y disponible.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
341 vistas5 páginas

Bases de Datos Distribuidas en Empresas

El documento describe los sistemas de bases de datos distribuidas de Amazon y Netflix. Amazon utiliza Amazon Aurora, que replica datos en múltiples zonas de disponibilidad dentro de AWS. Netflix usa Apache Cassandra, que distribuye datos a través de múltiples nodos para admitir recomendaciones personalizadas y contenido a gran escala. Ambas compañías requieren soluciones escalables para manejar grandes volúmenes de datos de manera confiable y disponible.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 5

Tarea 6. Sistema de base de datos de dos empresas.

BASES DE DATOS II

Alumna: Estefanía Rodríguez Sánchez.

Facilitador: José de Jesús Fernández Partida

Carrera: Ingeniería en sistemas computacionales.

Ciclo:8.

Tarea 6. Sistema de base de datos de dos empresas.

Fecha: 4 de junio del 2023


Tarea 6. Sistema de base de datos de dos empresas.

Introducción

Una base de datos distribuida, también conocida como BDD, es un sistema de


almacenamiento de datos que se encuentra distribuido en múltiples nodos o
servidores interconectados. A diferencia de las bases de datos centralizadas,
donde todos los datos se almacenan en un único lugar, en una base de datos
distribuida, los datos se dividen y se almacenan en diferentes ubicaciones físicas.
En una base de datos distribuida, cada nodo o servidor tiene su propia capacidad
de almacenamiento y procesamiento, lo que permite un mayor rendimiento y
escalabilidad. Además, los datos se replican o distribuyen estratégicamente entre
los nodos para garantizar la disponibilidad y la tolerancia a fallos.
Desarrollo
Las bases de datos distribuidas son importantes debido a su capacidad para
brindar claridad en la ubicación de los datos y mantener el control local. Cada sitio
en la red puede controlar y administrar los datos localmente, lo que significa que
incluso si las aplicaciones no conocen la ubicación exacta de los datos, cada sitio
puede gestionar la seguridad, realizar el registro de transacciones y recuperarse
de problemas locales. Esta autonomía local es crucial, ya que incluso si la
conectividad con otros sitios se interrumpe, cada sitio puede seguir funcionando
de manera independiente. Esto proporciona flexibilidad en situaciones donde
ciertos datos especializados almacenados en ubicaciones específicas requieren
restricciones adicionales de seguridad y cumplimiento que otros datos.
Ejemplo de dos empresas de la actualidad que ocupan sistema de base de datos
distribuidas:

Estructura de la base de datos distribuida de Amazon:


Amazon utiliza un sistema de base de datos distribuida altamente escalable y
flexible llamado Amazon Aurora. Aurora es compatible con MySQL y PostgreSQL y
está diseñado para ofrecer un rendimiento y disponibilidad de nivel empresarial.
Utiliza una arquitectura de almacenamiento distribuido que replica
automáticamente los datos en múltiples zonas de disponibilidad dentro de una
región de AWS (Amazon Web Services). Esto permite una alta disponibilidad y
Tarea 6. Sistema de base de datos de dos empresas.

durabilidad de los datos, así como una capacidad de escalado horizontal para
manejar cargas de trabajo intensivas.
Razones para tener una base de datos distribuida:
Amazon utiliza una base de datos distribuida para satisfacer las demandas de
escalabilidad y disponibilidad de su plataforma. Como empresa de comercio
electrónico y servicios en la nube, Amazon maneja grandes volúmenes de datos y
necesita una infraestructura de base de datos que pueda crecer y adaptarse a
medida que aumenta la carga de trabajo. La base de datos distribuida les permite
distribuir la carga de trabajo en múltiples nodos y regiones, lo que proporciona un
mejor rendimiento y alta disponibilidad en caso de fallos.
Sistema de Manejo de Bases de Datos Distribuidas (SMBDD) utilizado:
Amazon utiliza su propio sistema de base de datos distribuida llamado Amazon
Aurora. Aurora es compatible con las interfaces de MySQL y PostgreSQL, lo que
facilita la migración de aplicaciones existentes a la plataforma de Amazon.
Elección de SMBDD y su desempeño:
Amazon eligió desarrollar Amazon Aurora como su sistema de base de datos
distribuida para satisfacer sus necesidades específicas de escalabilidad,
rendimiento y disponibilidad. Aurora ha demostrado un rendimiento excepcional en
términos de velocidad de lectura y escritura, y ha logrado tiempos de recuperación
rápidos en caso de fallos. Además, Aurora es compatible con herramientas y
tecnologías estándar de la industria, lo que facilita la adopción por parte de los
desarrolladores y empresas que ya utilizan MySQL o PostgreSQL. En general, la
elección de Amazon Aurora como SMBDD ha sido exitosa para Amazon, ya que
les ha permitido ofrecer un servicio confiable y escalable a sus clientes.

Estructura de la base de datos distribuida de Netflix:


Netflix utiliza un sistema de base de datos distribuida llamado Apache Cassandra.
Cassandra es una base de datos altamente escalable y de alto rendimiento que se
basa en un modelo de datos distribuido sin un punto único de fallo. Netflix utiliza
múltiples clústeres de Cassandra distribuidos geográficamente para almacenar y
Tarea 6. Sistema de base de datos de dos empresas.

administrar los metadatos y registros de actividad de sus millones de usuarios, así


como para admitir la personalización y recomendaciones de contenido.
Razones para tener una base de datos distribuida:
Netflix necesita una base de datos distribuida para manejar la gran cantidad de
datos generados por sus usuarios y para garantizar una alta disponibilidad y
rendimiento de su plataforma de transmisión de video. La base de datos
distribuida permite a Netflix almacenar y procesar datos a gran escala de manera
eficiente, al tiempo que distribuye la carga de trabajo en múltiples nodos para
evitar cuellos de botella y puntos únicos de fallo.
Sistema de Manejo de Bases de Datos Distribuidas (SMBDD) utilizado:
Netflix utiliza Apache Cassandra como su sistema de base de datos distribuida.
Cassandra se ajusta bien a las necesidades de escalabilidad y rendimiento de
Netflix, ya que permite una distribución eficiente de datos a través de múltiples
nodos y ofrece una arquitectura altamente disponible y tolerante a fallos.
Elección de SMBDD y su desempeño:
La elección de Apache Cassandra como SMBDD por parte de Netflix ha sido
exitosa en términos de escalabilidad, rendimiento y disponibilidad. Cassandra ha
demostrado ser capaz de manejar grandes volúmenes de datos en tiempo real y
brindar una baja latencia de acceso a los datos, lo que es esencial para la entrega
de contenido en línea de alta calidad. Además, la capacidad de replicación y
distribución de Cassandra permite a Netflix garantizar la disponibilidad continua de
los datos, incluso en caso de fallas de nodos individuales o interrupciones en las
regiones geográficas. En general, Cassandra ha sido una elección sólida para
Netflix al proporcionar una base de datos distribuida confiable y escalable para
respaldar su plataforma de transmisión de video global.
En conclusión, las bases de datos distribuidas son una solución eficiente y
escalable para manejar grandes volúmenes de datos en entornos distribuidos. Al
distribuir los datos en varios nodos de una red, se logra mejorar el rendimiento y la
disponibilidad del sistema, así como aumentar la capacidad de almacenamiento y
procesamiento.

Referencias
Apache Cassandra: gestión distribuida de grandes bases de datos. (s. f.). Recuperado de:
https://www.ionos.mx/digitalguide/hosting/cuestiones-tecnicas/apache-cassandra/

Base de datos global de Amazon Aurora (s. f.). Recuperado de :


https://aws.amazon.com/es/rds/aurora/global-database/#:~:text=Bases%20de
%20datos%20globales%20de%20Amazon%20Aurora&text=La%20Base%20de
%20datos%20global,abarque%20m%C3%BAltiples%20regiones%20de%20AWS.
Tarea 6. Sistema de base de datos de dos empresas.

Kafesu, A. (2023). Apache Cassandra. Recuperado de: https://geekflare.com/es/apache-


cassandra/

Siles, F. (2015). Recuperado de: https://www.xataka.com/servicios/netflix-no-es-solo-


video-bajo-demanda-es-uno-de-los-grandes-monstruos-tecnologicos-de-la-historia

También podría gustarte