Sistemas de Información Gerencial
Resumen del Capítulo VI del Libro
Tabla de contenido
CAPITULO 6: Fundamentos de inteligencia de negocios: bases de datos y
administración de la información ....................................................................................... 2
6.1 ORGANIZACIÓN DE LOS DATOS EN UN ENTORNO DE ARCHIVOS
TRADICIONAL ............................................................................................................. 2
6.2 LA METODOLOGÍA DE LAS BASES DE DATOS PARA LA
ADMINISTRACIÓN DE DATOS ................................................................................ 5
CAPACIDADES DE LOS SISTEMAS DE ADMINISTRACIÓN DE BASES DE
DATOS .......................................................................................................................... 8
6.3 USO DE BASES DE DATOS PARA MEJORAR EL DESEMPEÑO DE
NEGOCIOS Y LA TOMA DE DECISIONES .............................................................. 10
6.4 ADMINISTRACIÓN DE LOS RECURSOS DE DATOS ............................... 15
CAPITULO 6: Fundamentos de inteligencia de negocios: bases de datos y
administración de la información
6.1 ORGANIZACIÓN DE LOS DATOS EN UN ENTORNO DE ARCHIVOS
TRADICIONAL
Dadas las necesidades de las empresas de hoy en día, es claro que al momento
de necesitar información, el sistema que se las provea debe tener una serie de
cualidades como ser precisa, oportuna y relevante. Sin embargo, a pesar de
haberse dicho esto, ese no suele ser el caso en muchas empresas debido a una
mala gestión a sus datos y/o Sistemas de Información. Para dar lugar a un mejor
entendimiento del problema, se procede a empezar con un sumario de
definiciones y conceptos.
El primer elemento de la jerarquía de datos en una computadora viene a ser un
bit, este es también el más pequeño; ahora un conjunto de bits es denominado
un byte, este representa un carácter. Un conjunto de caracteres que puede ser
una palabra o un número de varias cifras se denomina campo; un grupo de
campos relacionados es un registro y el grupo de registros se llama archivo; el
conjunto de archivos relacionados construye una base de datos. Un registro, por
otra parte constituye una entidad, que viene a ser una persona jurídica, lugar,
cosa, evento; y la característica relevante que describe a una entidad específica
se denomina atributo.
La forma tradicional en que un sistema de información de una organización
evolucionaba, era cada área individualmente, se desarrollaban aplicaciones
específicas para cada departamento. Sin embargo, esta forma de hacer las cosas
es sumamente ineficiente, el desarrollo de cada aplicativo requiere de inversión,
y tiempo, además de que cada uno necesita de datos y sus propios archivos, esto
generaba una gran redundancia de datos y ocasiona que en unos años la
organización se ve atestada de cientos de programas y aplicaciones que son muy
difíciles de mantener y administrar. Algunos de los mayores inconvenientes que
derivan de este tipo de problemas son:
Redundancia e inconsistencia de datos
Dependencia de sincronización programa – datos
Falta de flexibilidad necesaria de los aplicativos creados
Defectuosa seguridad de la información
Falta de compartición y disponibilidad de los datos
Estos, claro, son resueltos siguiendo una metodología, la de facilitar la gestión
de la información a través de un gran Sistema de Administración de base de
Datos (DBMS).
El DBMS libera al programador o al usuario final de la tarea de comprender en
dónde y cómo están almacenados los datos en realidad. El software de
administración de bases de datos se encarga de que la base de datos física esté
disponible para las diferentes vistas lógicas requeridas por los usuarios. Un
DBMS reduce la redundancia e inconsistencia de los datos al minimizar los
archivos aislados en los que se repiten los mismos datos, también desacopla los
programas y los datos, con lo cual estos últimos se pueden independizar.
Uno de los modelos de DBMS más usados actualmente es el DBMS Relacional,
algunas de las características de esta viene a ser:
Una base de datos se compone de varias tablas o relaciones.
No pueden existir dos tablas con el mismo nombre ni registro.
Cada tabla es a su vez un conjunto de campos (columnas) y registros
(filas).
La relación entre una tabla padre y un hijo se lleva a cabo por medio de
las claves primarias y claves foráneas (o ajenas).
Las claves primarias son la clave principal de un registro dentro de una
tabla y estas deben cumplir con la integridad de datos.
Las claves ajenas se colocan en la tabla hija, contienen el mismo valor que
la clave primaria del registro padre; por medio de estas se hacen las
formas relacionales.
Actualmente ya se están requiriendo que las bases de datos almacenen más que
sólo datos y/o caracteres, las DBMS diseñadas por filas y columnas no se
adaptan bien a aplicativos que trabajen con multimedia, pero las DBMS
orientadas a objetos prueban ser más adecuadas para eso.
6.2 LA METODOLOGÍA DE LAS BASES DE DATOS PARA LA ADMINISTRACIÓN
DE DATOS
Un Sistema de Administración de Bases de Datos (DBMS) es software que
permite a una organización centralizar los datos, administrarlos en forma eficiente
y proveer acceso a los datos almacenados mediante programas de aplicación. El
DBMS actúa como una interfaz entre los programas de aplicación y los archivos
de datos físicos.
Cómo resuelve un DBMS los problemas del entorno de archivos tradicionales
Un DBMS reduce la redundancia e inconsistencia de los datos al minimizar los
archivos aislados en los que se repiten los mismos datos. Tal vez el DBMS no
logre que la organización elimine la redundancia de datos en su totalidad, pero
puede ayudar a controlarla. El DBMS permite a la organización administrar los
datos, su uso y su seguridad en forma central.
DBMS relacional
Las Bases de datos relacionales representan los datos como tablas
bidimensionales (llamadas relaciones). Las tablas podrían considerarse como
archivos. Cada tabla contiene datos acerca de una entidad y sus atributos.
El tipo más popular de sistemas DBMS en la actualidad para las PCs, así como
para computadoras más grandes y mainframes, es el DBMS relacional. Las
bases de datos relacionales representan los datos como tablas bidimensionales
(llamadas relaciones), a las cuales se puede hacer referencia como si fueran
archivos.
Operaciones de un DBMS relacional
En una base de datos relacional se utilizan tres operaciones básicas para generar
conjuntos de datos útiles: seleccionar, proyectar y unir.
La operación seleccionar crea un subconjunto que consiste en todos los registros
del archivo que cumplan con criterios establecidos. En otras palabras, la
selección crea un subconjunto de filas que cumplen con ciertos criterios.
La operación unir combina tablas relacionales para proveer al usuario más
información de la que está disponible en las tablas individuales.
La operación proyectar crea un subconjunto que consiste de columnas en una
tabla, con lo cual el usuario puede crear nuevas tablas que contengan sólo la
información requerida.
DBMS orientado a objetos
Un DBMS orientado a objetos almacena los datos y los procedimientos que
actúan sobre esos datos como objetos que se pueden recuperar y compartir de
manera automática. Los Sistemas de Administración de Bases de Datos
Orientados a Objetos (OODBMS) están ganando popularidad debido a que se
pueden utilizar para manejar los diversos componentes multimedia o los applets
de Java que se utilizan en las aplicaciones Web, que por lo general integran
piezas de información provenientes de una variedad de orígenes
Bases de datos en la nube
Los proveedores de computación en la nube ofrecen servicios de administración
de bases de datos, pero por lo general estos servicios tienen menos funcionalidad
que sus contrapartes dentro de las premisas de la empresa. Por el momento, la
base de clientes primordial para la administración de datos basados en la nube
consiste en Capacidades de los sistemas de administración de bases de datos
empresas iníciales enfocadas en Web o negocios desde pequeños hasta
medianos que
buscan capacidades de bases de datos a un menor precio que el de un DBMS
relacional estándar.
CAPACIDADES DE LOS SISTEMAS DE ADMINISTRACIÓN DE BASES DE
DATOS
Un DBMS incluye capacidades y herramientas para organizar, administrar y
acceder a los datos en la base de datos. Las más importantes son: su lenguaje
de definición de datos, el diccionario de datos y el lenguaje de manipulación de
datos.
Consultas e informes
Un DBMS contiene herramientas para acceder a la información en las bases de
datos y manipularla. La mayoría de los DBMS tienen un lenguaje especializado
conocido como lenguaje de manipulación de datos el cual se utiliza para agregar,
modificar, eliminar y recuperar los datos en la base. Este lenguaje contiene
comandos que permiten a los usuarios finales y a los especialistas de
programación extraer los datos de la base para satisfacer las solicitudes de
información y desarrollar aplicaciones. El lenguaje de manipulación de datos más
prominente en la actualidad es el lenguaje de consulta estructurado, o SQL.
DISEÑO DE BASES DE DATOS
Para crear una base de datos hay que comprender las relaciones entre la
información, el tipo de datos que se mantendrán en la base, cómo se utilizarán y
la forma en que tendrá que cambiar la organización para administrarlos desde
una perspectiva a nivel de toda la compañía. La base de datos requiere tanto un
diseño conceptual como uno físico.
Diagramas de normalización y de entidad-relación
El diseño de bases de datos conceptual describe la forma en que se deben
agrupar los elementos de datos en la base. El proceso de diseño identifica las
relaciones entre los elementos de datos y la manera más eficiente de agruparlos
en conjunto para satisfacer los requerimientos de información de la empresa.
Los diseñadores de bases de datos documentan su modelo de datos con un
diagrama entidad-relación.
Los cuadros representan las entidades, y las líneas que conectan los cuadros,
las relaciones. Una línea que conecta dos entidades que termina en dos marcas
cortas designa una relación de uno a uno. Una línea que conecta dos entidades
y termina con una pata de cuervo y una marca corta encima de ella indica una
relación de uno a varios.
• Distribución de Bases de Datos
El diseño de bases de datos también abarca la manera en que se distribuyen los
datos. Se pueden diseñar sistemas de información con una base de datos
centralizada que sea utilizada por un procesador central único o por múltiples
procesadores en una red cliente/servidor.
Los sistemas distribuidos reducen la vulnerabilidad de un solo sitio central masivo.
Incrementan el servicio y el nivel de respuesta para los usuarios locales y con
frecuencia pueden correr en computadoras más pequeñas y menos caras. Sin
embargo, las bases de datos locales en ocasiones pueden desviarse de los
estándares y definiciones centrales de datos y plantear problemas de seguridad
por la amplia distribución del acceso a datos delicados.
6.3 USO DE BASES DE DATOS PARA MEJORAR EL DESEMPEÑO DE
NEGOCIOS Y LA TOMA DE DECISIONES
Las empresas utilizan sus bases de datos para dar seguimiento a las
transacciones básicas. Pero también, se las necesitan para suministrar
información que ayudará a la empresa a manejar los negocios de manera más
eficiente, y que ayudará a los gerentes y a los empleados a tomar mejores
decisiones.
ALMACENES DE DATOS
Un almacén de datos es una base de datos que almacena la información actual
e histórica de interés potencial para los encargados de tomar decisiones en la
compañía. Los datos se originan en muchos sistemas de transacciones
operacionales básicos, como los sistemas de ventas, las cuentas de clientes, la
manufactura, y pueden incluir datos de transacciones de sitios Web. El almacén
de datos consolida y estandariza la información de distintas bases de datos
operacionales, de modo que se pueda utilizar en toda la empresa para el análisis
gerencial y la toma de decisiones.
Mercados de datos
Un mercado de datos es un subconjunto de un almacén de datos en el que una
parte resumida o altamente enfocada de los datos de la organización se coloca
en una base de datos separada para una población específica de usuarios. Por
lo común, un mercado de datos se enfoca en una sola área objetivo o línea de
negocios, por lo que usualmente se puede construir más rápido y a un costo más
bajo que un almacén de datos a nivel de toda la empresa.
HERRAMIENTAS PARA LA INTELIGENCIA DE NEGOCIOS: ANÁLISIS DE
DATOS MULTIDIMENSIONAL Y MINERÍA DE DATOS
Las herramientas de inteligencia de negocios permiten a los usuarios analizar
datos para ver nuevos patrones, relaciones y perspectivas que son útiles para
guiar la toma de decisiones. Las principales herramientas para la inteligencia de
negocios incluyen el software para consultas e informes de bases de datos,
herramientas para el análisis de datos multidimensional (procesamiento analítico
en línea), y herramientas para la minería de datos.
Procesamiento analítico en línea (OLAP)
El procesamiento analítico en línea soporta el análisis de datos
multidimensionales, el cual permite a los usuarios ver los mismos datos en
diferentes formas utilizando múltiples dimensiones. Cada aspecto de la
información -producto, precio, etc- representa una dimensión diferente. OLAP
permite a los usuarios obtener respuestas en línea a preguntas específicas en un
lapso de tiempo sumamente rápido, aun cuando los datos estén almacenados en
bases de datos bastante grandes, como las cifras de ventas de varios años.
Minería de Datos
La minería de datos está más orientada al descubrimiento de información. La
minería de datos proporciona conocimientos acerca de los datos corporativos que
no se podrían obtener con OLAP, al encontrar patrones y relaciones ocultas en
robustas bases de datos en infiriendo reglas a partir de ellos para predecir el
comportamiento futuro. Los patrones y las reglas se utilizan para orientar la toma
de decisiones y predecir el efecto de tales decisiones. Los tipos de información
que se pueden obtener a partir de la minería de datos incluyen asociaciones,
secuencias, clasificaciones, agrupaciones y pronósticos.
La generación de pronósticos emplea una serie de valores existentes para
pronosticar qué otros valores habrá.
Uno de los usos populares de la minería de datos es ofrecer análisis detallado de
patrones existentes en los datos de clientes para realizar campañas de MKT o
para identificar clientes rentables.
El análisis predictivo utiliza técnicas de minería de datos, datos históricos y
suposiciones sobre condiciones futuras para predecir resultados de eventos,
como la probabilidad de que un cliente responderá a una oferta o comprará un
producto específico.
La minería de datos plantea riesgos para la protección de la privacidad individual.
La tecnología de minería de datos puede combinar información de muchas
fuentes diversas para crear una “imagen de datos” detallada sobre cada uno de
nosotros.
Minería de datos y minería Web
La principal función de las herramientas de inteligencia de negocios es lidiar con
los datos que se han estructurado en bases de datos y archivos. Sin embargo,
se cree que los datos no estructurados, que en su mayoría están organizados en
forma de archivos de texto, representan más del 80 por ciento de la información
útil de una organización. En la actualidad hay herramientas de minería de texto
disponibles para ayudar a las empresas a analizar estos datos. Estas
herramientas pueden extraer elementos clave de los conjuntos de datos extensos
no estructurados, descubrir patrones y relaciones, así como sintetizar la
información.
La Web es otra fuente extensa de información valiosa, y parte de ésta se puede
explotar en busca de patrones, tendencias y perspectivas en relación con el
comportamiento de los clientes. El descubrimiento y análisis de los patrones
útiles y la información proveniente de World Wide Web se denominan minería
Web. Las empresas podrían recurrir a la minería Web para que les ayude a
comprender el comportamiento de los clientes, evaluar la efectividad de un sitio
Web específico o cuantificar el éxito de una campaña de marketing.
La minería Web busca patrones en los datos a través de la minería de contenido,
la minería de estructura y la minería de uso. La minería de contenido Web es el
proceso de extraer conocimiento del contenido de páginas Web, lo cual puede
incluir datos de texto, imágenes, audio y video. La minería de estructura Web
extrae información útil de los vínculos incrustados en documentos Web.
LAS BASES DE DATOS Y WEB
Muchas empresas utilizan ahora la Web para poner parte de la información de
sus bases de datos internas a disposición de sus clientes y socios de negocios.
El usuario accede al sitio Web del detallista por medio de Internet, utilizando un
navegador Web instalado en su Pc del cliente. El navegador Web del usuario
solicita datos a la base de la organización, utilizando comandos HTML para
comunicarse con el servidor Web.
El servidor Web pasa las solicitudes de datos a software que traduce los
comandos HTML a SQL para que los pueda procesar el DBMS que trabaja con
la base de datos. En un entorno cliente/servidor, el DBMS reside en una
computadora dedicada denominada servidor de base de datos. El DBMS recibe
las solicitudes de SQL y suministra los datos requeridos. El middleware transfiere
información desde la base de datos interna de la organización de regreso al
servidor Web para que se entregue en forma de página Web al usuario.
Las ventajas de utilizar la Web para acceder a las bases de datos internas de una
organización:
1. Un navegador es más sencillo de utilizar que las herramientas de consulta
propietarias.
2. La interfaz Web requiere pocos cambios o ninguno a la base de datos interna.
Cuesta mucho menos agregar una interfaz Web a un sistema heredado que
rediseñar y volver a construir el sistema para mejorar el acceso a los usuarios.
El acceso a bases de datos corporativas a través de la Web está creando nuevas
eficiencias, oportunidades y modelos de negocios.
6.4 ADMINISTRACIÓN DE LOS RECURSOS DE DATOS
Toda empresa, ya sea grande o pequeña, necesita una política de información.
Los datos de su empresa son un recurso importante, por lo que no es conveniente
que las personas hagan lo que quieran con ellos. Necesita tener reglas sobre la
forma en que se van a organizar y mantener los datos, y quién tiene permitido
verlos o modificarlos
ESTABLECIMIENTO DE UNA POLÍTICA DE INFORMACIÓN
Una política de información específica las reglas de la organización para
compartir, distribuir, adquirir, estandarizar, clasificar e inventariar la información.
Esta establece procedimiento y responsabilidades específicos, que identifican
cuáles usuarios y unidades de la organización pueden compartir información,
dónde se puede distribuir la información y quién es responsable de actualizar y
mantener la información.
La administración de datos es responsable de las políticas y procedimientos
específicos por medio de los cuales se pueden manejar los datos como un
recurso organizacional. Estas responsabilidades incluyen desarrollar la política
de información, planificar los datos, supervisar el diseño lógico de la base de
datos y el desarrollo del diccionario de datos, y vigilar la manera en que los
especialistas en sistemas de información y los grupos de usuarios finales utilizan
los datos.
Una organización grande tendrá un grupo de diseño y administración de bases
de datos dentro de la división de sistemas de información corporativa,
responsable de definir y organizar la estructura y contenido de la base de datos,
así como su mantenimiento.
ASEGURAMIENTO DE LA CALIDAD DE LOS DATOS
Una base de datos y una política de información bien diseñadas contribuirán a
garantizar que la empresa tenga la información que necesita. Sin embargo, se
deben emprender acciones adicionales para asegurar que la información de las
bases de datos de la organización sea exacta y confiable.
Antes de implementar una nueva base de datos, las organizaciones necesitan
identificar y corregir sus datos incorrectos y establecer mejores rutinas para editar
los datos una vez que su base esté en operación. Con frecuencia, el análisis de
la calidad de los datos empieza con una auditoría de calidad de los datos, la cual
es una encuesta estructurada de la precisión y el nivel de su integridad en un
sistema de información.
Las auditorías de calidad de los datos se pueden realizar mediante la inspección
de los archivos de datos completos, la inspección de muestras provenientes de
los archivos de datos, o mediante encuestas a los usuarios finales sobre sus
percepciones en cuanto a la calidad de los datos.
La limpieza de datos, (data scrubbing), consiste en actividades para detectar y
corregir datos en una base que sean incorrectos, incompletos, que tengan un
formato inapropiado o que sean redundantes. La limpieza de datos también
impone la consistencia entre los distintos conjuntos de datos que se originan en
sistemas de información separados.