0% encontró este documento útil (0 votos)
26 vistas13 páginas

Proceso ETL y Fuentes de Datos en BI

Cargado por

lpilar7702
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
26 vistas13 páginas

Proceso ETL y Fuentes de Datos en BI

Cargado por

lpilar7702
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Introducción a ETL

ETL (Extract, Transform, Load) es un proceso utilizado en el ámbito


de la gestión de datos para la integración y transformación de datos
desde múltiples fuentes heterogéneas hacia un destino común, como
un almacén de datos.

Al proceso ETL también se le llama Flujo de datos, que son los pasos
que deben seguir los datos en su estado inicial (sistema fuente) para
que sean extraídos, transformados y finalmente cargados en el
sistema SAP BI.

Proceso de Extracción: La primera parte del proceso ETL consiste


en extraer los datos desde los sistemas de origen. Cada sistema
puede tener almacenados los datos de maneras diferentes, puede
ser en Excel, archivo plano, XML, bases de datos relacionales, entre
otros.

La extracción busca obtener los datos y dejarlos listos para que se les pueda aplicar algún proceso de
transformación. Se deben analizar los datos a extraer para determinar cuales seran utiles o no, tambien
determinar el impacto que puede generar esta extracción en el sistema fuente, ya que podría perjudicar a los
sistemas transaccionales y por lo tanto complicar la operación diaria de la empresa.

Proceso de transformación: Busca adaptar los datos extraídos en datos que finalmente serán cargados en
el Datawarehouse. Estas transformaciones serán adaptaciones de los datos basandose en las reglas
preestablecidas del negocio.

Unidad 2: El proceso de ETL / Lección: Fuentes de Datos:

Sistemas Fuentes y Tipos de Sistemas Fuentes.

• Cualquier sistema SAP, esto incluye toda la gama, desde el ERP, CRM, SRM hasta otro sistema SAP
BI

• Otros Sistemas BI

• Archivos planos

• Bases de datos, éstas se conectan utilizando el conector DB Connect

• Otras fuentes relacionales que se conectan utilizando el conector UD Connect

• Servicios Web que transfieren datos mediante lo que es llamado Push

• Sistemas que se conectan utilizando BAPIs preparadas para estos casos


Extracciones de datos en tiempo real

Se puede utilizar adquisición de datos en tiempo real, si se desea transferir datos a BI en intervalos frecuentes
( cada hora o cada minuto ) y acceder a estos datos en reporting frecuentemente ( más de una vez al día,
como mínimo). la fuente de datos tiene que soportar la adquisición de datos en tiempo real.

Las fuentes de datos servicio Web y las fuentes de datos desde un sistema fuente SAP pueden soportar la
adquisición de datos en tiempo real.

Extracciones de datos con el servicio API

El API de servicio BI ( Application Programming Interface) se basa exclusivamente en la tecnología SAP y se


utiliza en diversos puntos dentro de la arquitectura BI:

• Para transferir datos y metadatos desde sistemas fuente SAP

• Con la transferencia de datos XML/SOAP basada en una fuente de datos 3.x XML

• Con la transferencia de datos utilizando la interface Data Mart

Extracciones de datos de ficheros planos

La extraccion de ficheros planos es el método más común para integrar datos de sistemas externos a un
sistema BI. De esta manera, es muy importante conocer su función y consideraciones especiales.

Extracciones de datos con DB Connect

Con DB Connect, SAP Proporciona otra opción para extraer datos desde sistemas externos. DB Connect
permite extraer datos desde tablas/vistas en sistemas de gestion de bases de datos (DBMS), los cuales
además de tener conexión estandar, tambien están conectados al sistema BI y transfieren los datos al sistema
BI.

Se pueden utilizar tablas y vistas desde DBMS soportado por SAP para la transferencia de datos. A
continuación se puede utilizar una fuente de datos para hacer que estos estén disponibles en BI y se
transfieran a InfoSitios utilizando el proceso de adquisición de datos habitual.

Para cargar datos desde DBMS soportado por SAP en BI utilizando DB Connect se debe:

Conectar una base de datos al sistema BI como sistema fuente, proporcionando el acceso directo al DBMS
externo y relacional RDBMS.

Dar a conocer los metadatos para la tabla/vista del RDBMS externo en BI, utilizando la definición de una
fuente de datos.
Extracciones de datos con integración de datos Universal ( UDI )

El nuevo desarrollo de la tecnología UDI para BI se basaba principalmente en la demanda de mercado para
opciones de integración mejoradas entre BI e infraestructuras de sistemas existentes y heterogéneos. Existe
una demanda para escenarios en los que la preparación de datos puede desplegarse hasta un intervalo más
amplio de fuentes de datos y las restricciones en DB Connect se soportan sin hacer uso de heramientas ETL
Externas.

Debe ser posible acceder a ambos sistemas DBM, multidimensional y relacional. Los escenarios transitorios
(acceso directo utilizando VirtualProviders)
tambien deberían ser posibles, así como la
preparación convencional y persistente de
datos en BI.

Extracciones de Datos basada en XML

Muchas aplicaciones utilizan XML


independiente de plataforma y estandarizado
para intercambiar datos ( ejemplo servicios
web, Sap Netweaver Exchange Infraestructure )

Puede utilizar fuente de datos de servicio web para integrar tales fuentes XML con SAP Netweaver BI y hacer
que la información de la fuente externa XML esté disponible para el análisis de datos dentro de su sistema
BI.

La integración abierta y flexible con aplicaciones externas solo puede alcanzarse sin la integración se basa
en estándares generalmente aceptados. La plataforma SAP Netweaver implementa los siguientes estandares
básicos y abiertos para soportar la integración de datos en BI basados en XML.

eXtensible Markup Language XML

Simple Objetct Access Protocol SOAP

Extracciones de datos con herramientas ETL Externas

La extracción externa, transformación y herramientas de carga (ETL) tambien pueden utilizarse para la
extracción de datos. Las funciones de estas herramientas son específicas para la herramienta individual.

Para poder extraer datos y metadatos desde sistemas externos, SAP BI suministra interfaces abiertas, BAPI
(Business Application Programming Interfaces) de preparación. Estas interfaces le permiten conectar
diferentes herramientas ETL con SAP BI.

Las fuentes de datos independientemente de que sistema fuente provenga se ve representada en su


estructura física de sistema mediante una tabla interna PSA Persistent Staging Area, para acceder al
contenido de dicha tabla se ingresa a la transaccion RSA1 y posicionarse sobre la fuente de datos, ahí con
botón derecho "Gestionar" y se verán todas las solicitudes de carga de dicha tabla PSA

Creando una fuente de datos

Transacción RSA1 ->invoca al Workbench que permite


realizar muchas de las operaciones de modelado de los
distintos objetos. en esta transaccion ubicarse en Source
Systems ( Sistemas Fuentes )
Fuente de datos(DataSource) y Sistema fuente.

Un sistema fuente es la conexión y representación de un sistema externo a SAP BW. Ejemplo otro sistema
SAP, archivos planos o base de datos externa.

Dentro de los sistemas fuentes se encuentran definidas las fuentes de datos que son estructuras de datos
que representan, por ejemplo, una tabla en particular dentro del sistema fuente. Un sistema fuente puede
contener N fuentes de datos definidas.

Realizando extracción

Realizar los pasos de archivo SOLUCION_ EJERCICIO_Unidad_2_Leccion_3.pdf

Unidad 2: El proceso de ETL / Lección: Video - Realizando Extracciones:

Source System: Conexión hacia los sistemas de los que se extraerán datos. Pueden ser archivos, sistemas
SAP, el mismo BW, otros. Es el sistema o la aplicación de donde provienen los datos. Puede ser un sistema
transaccional, un sistema externo o cualquier otra fuente de datos.

Data Source: estructura de datos en particular dentro del source system. Fisicamente una estructura de tabla
que se completa de información mediante procesos de extracción que se ejecutan en el sistema fuente. Es la
representación de la fuente de datos en el entorno de SAP BW. Actúa como un enlace entre el Source System
y SAP BW.

Infosource: Estructura temporal dentro de SAP BW que permite realizar una transformación de la información
antes de ser almacenada en un objeto definitivo ( Ejm. Infocubos ). En la version 7 ya no es obligatorio el uso
de ellas. Es un componente en SAP BW que permite combinar, transformar y enriquecer los datos extraídos
de la Data Source antes de cargarlos en los objetos de datos finales

Componentes de aplicación: Se utilizan de manera que podamos organizar distintos Data Source (Fuentes
de datos) dentro del Source System ( sistemas fuentes ) y así poder ubicarlos fácilmente en nuestro sistema
SAP BW. Es una agrupación lógica de objetos relacionados en SAP BW. Se puede considerar como una
unidad organizativa que contiene varios objetos como InfoSources, InfoCubes, DataSources, entre otros.

En resumen, el Source System es la fuente de datos original, la Data Source es la representación de esa
fuente en SAP BW, el InfoSource permite transformar y enriquecer los datos antes de cargarlos, y el
Application Component es una unidad organizativa que agrupa los objetos relacionados en SAP BW. Estos
términos están relacionados entre sí para permitir la extracción, transformación y carga de datos en SAP BW
de manera estructurada y organizada.

Unidad 2: El proceso de ETL / Lección: Transformaciones:

Transformaciones

Rutinas de inicio (Start Rutine)

La primera sección del proceso de transformación es la rutina de inicio, se ejecuta de forma personalizada en
ABAP para cada paquete de datos al inicio de la transformación.

Esta rutina no tiene valores de retorno. Se utiliza para efectuar cálculos preliminares y almacenarlos en una
estructura de datos global o en una tabla. Se puede acceder a esta estructura o tabla desde otras rutinas.
También se puede modificar o borrar datos. Con esta rutina se puede acceder al paquete entero de datos.

Cuando entramos en una transformación en la zona superior se tiene la


opción de crear una rutina de inicio.

A continuación de haberla creado da la posibilidad de utilizar código ABAP.


Reglas de transformación

Aunque las rutinas de inicio son ayudas potentes de rendimiento, obligan a realizar código ABAP. En la
mayoría de los casos las transformaciones son asignaciones de campo sencillas o constantes que no
necesitan codificación.

Generalmente las transformaciones más complejas pueden ser realizadas con éxito utilizando el editor de
fórmulas ( Que genera el código automáticamente ) en caso contrario se utiliza ABAP.

Las reglas de transformación se llevan a cabo para cada campo o cada registro de datos del paquete de datos
tras la rutina de inicio.

Una simple regla de transformación campo a campo (asignación directa) puede realizarse mediante las
características arrastrar y soltar que conectan el campo A de la fuente con el campo B de destino. Para
opciones más complejas, puede acceder a los detalles de la regla haciendo doble clic en el campo destino.

Pasos para la unión de campos

Posicionarse en el campo fuente que se quiere unir

Dejar presionado el botón del mouse y mover la flecha hasta el campo destino y soltar

Se verán las diferentes opciones que se pueden encontrar al momento de hacer la unión:

Asignación directa

El campo se llena directamente desde el InfoObjeto fuente seleccionado. Si el sistema no propone un


InfoObjeto fuente, puede asignar un InfoObjeto fuente de la misma clase ( importe, numero, entero, cantidad,
tiempo) o crear una rutina.

Si asigna un InfoObjeto fuente a un InfoObjeto destino que tiene la misma clase pero una moneda diferente,
debe convertir la moneda fuente a la moneda destino mediante una conversión de moneda, o convertir la
moneda de la fuente.

Si asigna una InfoObjeto fuente a un InfoObjeto de destino que tiene la misma clase pero una unidad de
medida distinta, deberá convertir la unidad de medida fuente a la unidad de medida de destino utilizando una
conversión de unidad de medida o transferir la unidad desde la fuente.
Constantes

El infoObjeto no ha completado el campo, pero está diligenciado directamente con el valor especificado.

Datos maestros de lectura

El InfoObjeto se actualiza con la lectura de la tabla de datos maestros de una característica incluida en la
fuente con una clave y un valor, y contiene el infoObjeto correspondiente como atributo. Los atributos y sus
valores se leen desde la clave, después se devolverán.

Rutina

El campo está completado por la rutina de transformación que ha escrito en ABAP

El sistema ofrece la opción de selección que permite decidir si la rutina es válida para todos los atributos que
pertenecen a esta característica, o solo para los atributos personalizados. Las reglas de transformación
generalmente solo tienen un código de retorno.

Se puede utilizar la opción por ejemplo para convertir KG de la fuente a


toneladas en el destino, si completa el ratio de destino desde una rutina
de transformación, la conversión de moneda debe efectuarse mediante
la rutina de transformación. Esto significa que el cálculo automático no
es posible.

Existen casos en los que con el editor de formulas no es suficiente y una


rutina de inicio o final se utiliza especialmente cuando se tocan varios
infoObjetos al mismo tiempo, en esos casos se utiliza ABAP solo en el
infoObjeto destino que se necesita como a continuación en la imagen:

Una vez que finaliza la rutina, la manera de identificar que el infoObjeto está trabajando
con una rutina, es como el ícono en la imagen:

Fórmula

El infoObjeto se actualiza con un valor determinado mediante una fórmula.

Anteriormente, mediante utilización de codigo ABAP en una rutina,


teníamos que generar la lógica personalizada para asignar 10 caracteres
en 13.

El editor de fórmulas automatizado, una herramienta SAP puede escribir


ABAP si se le proporciona la lógica básica

Rutina final (End Rutine)

Una rutina final es una rutina con una tabla en el formato de estructura
de destino como parámetro de entrada y como parámetro de salida.
Puede utilizar una rutina final para ejecutar el tratamiento posterior de
datos después de la transformación en una base paquete a paquete.
Por ejemplo, puede borrar registros que no están actualizados o realizar verificaciones de calidad de datos.
A continuación de haberla creado da la posibilidad de utilizar código ABAP:

Rutinas de Experto ( Expert Rutine )

Esta clase de rutina solo debe utilizarse en casos especiales. Puede utilizarla para programar usted mismo la
transformación sin utilizar las clases de regla disponibles.

Debe implementar la transferencia de mensajes al monitor. A menos que esto se efectúe correctamente, no
podrá supervisar el DTP (Proceso de Transferencia de Datos).

Si ya se ha creado reglas de transformación, el sistema las borra una vez creada una rutina de experto. Al
escoger esta opción desaparecen todas las uniones que se hayan realizado en la transformación. por lo tanto
las flechas no se utilizarán mas y todo se hará a traves de codigo ABAP.

Para ir a rutina de experto hay que ir al menu tratar -> Rutina Experto.

En las transformaciones se procesan los registros que se encuentran en la tabla PSA, y la manera de tomar
esos registros se establecen en el DTP (Proceso de Transferencia de Datos) allí se pueden obtener las
cantidades de registros procesados por paquetes de datos. Una ventaja de estos es que se puede paralelizar
las cargas desde la PSA hacia el destino de datos. Como se puede notar la secuencia de ejecución de una
transformación sería la siguiente: primero rutina de inicio, segundo ejecución de las reglas de cada campo,
por ultimo la rutina final. La rutina de experto reemplaza las 3 antes mencionadas. Las rutinas son para realizar
complejas reglas de transformación

Clase de agregación

Utilizar la clase de agregación para controlar como se actualiza un ratio o campo de datos en el InfoSitio.
Caracteristicas para InfoCubos

En SAP BW, cuando se actualizan los ratios en un InfoCubo, se puede especificar una clase de agregación.
Esta clase de agregación determina cómo se procesan y actualizan los nuevos valores del ratio si las claves
primarias (los identificadores únicos) son iguales.

Las opciones de agregación disponibles son las siguientes:

Totalización de valores: Si se selecciona esta opción, los nuevos valores se suman al total existente para los
valores relacionados con las mismas claves primarias. Por ejemplo, si tienes un ratio de ventas por región y
se actualizan nuevas ventas para una región específica, se sumarán al total de ventas existente para esa
región.

Mínimo: Si se elige esta opción, se tomará el valor mínimo entre los nuevos valores y los valores existentes
relacionados con las mismas claves primarias. Por ejemplo, si tienes un ratio de temperatura mínima por
ciudad y se actualizan nuevos datos de temperatura mínima para una ciudad, se comparará el nuevo valor
con el valor mínimo existente y se conservará el más bajo.

Máximo: Si se selecciona esta opción, se tomará el valor máximo entre los nuevos valores y los valores
existentes relacionados con las mismas claves primarias. Por ejemplo, si tienes un ratio de ventas máximas
por producto y se actualizan nuevas ventas para un producto específico, se comparará el nuevo valor con el
valor máximo existente y se conservará el más alto.

En resumen, la clase de agregación especifica cómo se actualizan los ratios en un InfoCubo en SAP BW.
Puede ser mediante la totalización de valores, el mínimo o el máximo, dependiendo de la opción seleccionada.
Esto determina cómo se procesan y se actualizan los nuevos valores en función de las claves primarias de
los datos.

Ratio: Conocido como Keyfigure o indicador. Permite un parámetro de medición en un reporte. Los ratios son
medidas que se definen para las características creadas. Si tenemos la característica Cliente, la medida
Cantidad sería un Keyfigure y serviría para determinar la cantidad de clientes.

Los ratios, también conocidos como Keyfigures o indicadores, son como herramientas de medición que nos
permiten obtener información específica en un informe. Podemos pensar en ellos como números que nos
dicen algo sobre algo.

Por ejemplo, queremos saber la cantidad de clientes que tenemos. Para ello, utilizamos la característica
"Cliente" y definimos el ratio "Cantidad" como un Keyfigure. Este ratio nos daría el número exacto de clientes
que tenemos en ese momento.

Así que, básicamente, los ratios nos ayudan a obtener datos cuantitativos o medidas precisas sobre las
características que estamos analizando. Nos permiten hacer cálculos y obtener resultados numéricos que
nos ayudan a comprender mejor la información y tomar decisiones más informadas.

Infocubo: Son los principales modelos de datos multidimensionales en SAP. Su principal característica es
que se sumariza la información, a diferencia de una tabla relacional que la sobreescribe. Esta compuesto por
una tabla de hechos ( ratios ) y tablas de dimensiones ( características ) . Todos sus campos son campos
clave.

El infocubo es una estructura de datos en SAP que almacena información de manera sumarizada y
multidimensional. Está compuesto por una tabla de hechos que contiene los ratios a analizar, como ventas o
costos, y por tablas de dimensiones que describen características relacionadas, como fecha, producto o
región. Todos los campos en estas tablas son campos clave, utilizados para consultar y filtrar los datos de
forma eficiente. La multidimensionalidad del infocubo se refiere a su capacidad para representar y analizar
datos en diferentes perspectivas o dimensiones, como tiempo, producto y territorio. Esto permite realizar
análisis detallados desde diversos ángulos y obtener información valiosa para la toma de decisiones.

Características para InfoObjetos

Para los InfoObjetos en SAP, se utiliza únicamente la opción de Sobreescribir. Esta opción permite actualizar
directamente los valores en el InfoObjeto sin realizar ningún tipo de cálculo o agregación. Un ejemplo de esto
sería el peso neto de un material, donde cada vez que se actualice, se sobrescribirá el valor anterior con el
nuevo valor ingresado. No se realiza ningún cálculo adicional ni se considera la existencia de datos anteriores,
simplemente se reemplaza el valor existente por el nuevo valor ingresado.

Características para objetos de DaraStore

Las características para objetos de DataStore en SAP BW permiten definir cómo se actualizan los valores en
función de la clase de datos y la fuente de datos. Hay varias opciones disponibles, como la totalización de
valores, el mínimo, el máximo o la sobrescritura. Al seleccionar una de estas opciones, los valores nuevos se
actualizan en el objeto DataStore. Por ejemplo, si se elige la opción de totalización de valores, los nuevos
valores se sumarán al total existente. Si se selecciona la opción de mínimo, se tomará el valor más bajo entre
los nuevos valores y los existentes. Si se elige la opción de sobrescritura, los nuevos valores reemplazarán por
completo los existentes. Estas opciones permiten controlar cómo se actualizan y manejan los datos en el objeto
DataStore, según los requisitos y la lógica de negocio específicos.

Unidad 2: El proceso de ETL / Lección: Carga de Datos:

Carga de Datos

Continuando con el proceso ETL llegamos al último paso en el cual vamos a poder
tener los datos disponibles para realizar un análisis.

Como se ve en la imagen existen 3 nuevos conceptos: Los InfoPaquetes, los


Procesos de Transferencia de Datos ( DTP ) y PSA ( Persistent Staging Area)

InfoPaquetes

El diseño del flujo de datos en SAP BW utiliza diferentes objetos de metadatos para
organizar y estructurar la transferencia de información. Estos objetos incluyen las fuentes de datos, las
transformaciones, las InfoFuentes y los InfoSitios. Una vez que el flujo de datos está diseñado, los
InfoPaquetes y los procesos de transferencia de datos se encargan de ejecutar y planificar la transferencia
real de los datos. En resumen, estos objetos de metadatos y procesos gestionan todo el proceso de
transferencia de datos, desde el diseño inicial hasta la ejecución planificada.

El primer proceso es la carga de datos desde el sistema fuente. Esto implica varios pasos diferentes entre sí
que dependen del sistema fuente implicado. Por ejemplo si se trata de un sistema fuente SAP, puede
efectuarse una llamada de función al otro sistema y podría iniciarse un programa extractor asociado con la
fuente de datos.

InfoPaquete:
Un InfoPaquete es un objeto en SAP BI que contiene todas las configuraciones y ajustes necesarios para
cargar datos desde un sistema fuente. Estas parametrizaciones definen cómo se debe realizar la carga de
datos, incluyendo el origen de los datos, el método de extracción, las transformaciones necesarias y otros
ajustes relacionados. Básicamente, el InfoPaquete proporciona las instrucciones detalladas para extraer y
cargar los datos desde el sistema fuente al sistema de SAP BI de manera correcta y eficiente. El InfoPaquete
es el componente central que permite extraer datos de fuentes externas y cargarlos en SAP BW para su
posterior procesamiento y análisis, asegurando que los datos estén disponibles en el sistema para su uso en
informes y análisis de negocios.

El destino del InfoPaquete es la tabla PSA vinculada a la fuente de datos específica asociada con el
InfoPaquete. En un entorno productivo, los mismos datos en el mismo sistema fuente sólo deberían extraerse
una vez con un InfoPaquete.

A partir de aquí los procesos de transferencia de datos pueden hacer llegar estos datos a tantos InfoSitios
como sea necesario.

A continuación los diferentes pasos para la creación de un infoPaquete y la


explicación breve de las pestañas:

1. Clic derecho en el DataSource (Fuente de datos) y seleccionar Crear InfoPaquete


Aparece la siguiente imagen para colocar la descripción del infoPaquete

Aparecen las siguientes pestañas. En selección de datos aparecen los objetos que fueron establecidos al
momento de la creación de la Fuente de Datos para poder ser usados como filtros.

La pestaña Extracción se adaptará según el tipo de


fuente de datos a la que se está conectando. En este
caso es un infoPaquete para extraer datos desde un
fichero.

Se selecciona donde está el archivo, si en un servidor o


una estación de trabajo. Establezco cuales son los
separadores, cual es el caracter que representa el final
del archivo.

Se puede ver el icono que permite poner rutina ABAP por


ejemplo el nombre del archivo a subir y que cambie
dinamicamente dependiendo la fecha.

La pestaña Proceso da más opciones a parte de Solo PSA si nuestra fuente de datos es de la versión 3.x que
nos permitía otras variantes. Con la opción Paralell seleccionamos la cantidad de procesos que utilizaremos
en simultáneo para la carga de datos hasta la PSA.

La pestaña Destino de Datos también es utilizada con las Fuentes de Datos 3.x ( Version anterior de SAP
BW)
La pestaña Actualización da la opción en caso que la fuente de datos permita realizar Actualizaciones
completas o Actualizaciones Delta

La Pestaña Prever da la opción de ejecutar el InfoPaquete inmediatamente o programarlo mediante un job


contemplando un diagrama de Gantt para comprobar que no se superponga con otros procesos. Esta opción
es poco utilizada ya que generalmente los InfoPaquetes se programan dentro de una cadena de procesos.

Procesos de Transferencia de Datos

El proceso de transferencia de datos es una etapa fundamental en el flujo de datos. Controla cómo los datos
fluyen y se actualizan para una transformación específica, aplicando filtros y asegurando una correcta
actualización incremental o completa. Si hay múltiples pasos de transformación o destinos en el proceso ETL,
pueden existir varios procesos de transferencia de datos. Estos procesos garantizan que los datos sean
filtrados y actualizados adecuadamente antes de avanzar a la siguiente fase del flujo de datos. Se realiza
después de la extracción de datos y antes de la carga en el sistema de destino, como un InfoCubo o un objeto
DataStore.

Paso a paso creación DTP ( Proceso de Transferencia de Datos )

Posicionarse en el destino de datos, clic derecho en el objeto y seleccionar Crear Proceso


Tranf. datos

Determinar cual es la fuente que usará el DTP para llevar los datos al destino seleccionado.
Las opciones son: Fuente de datos, infocubo, ODS, InfoSet, InfoObjeto

En la configuración del Infopaquete, se encuentran tres pestañas importantes. En la pestaña de extracción,


se definen los filtros, la opción de actualización
(Full o Delta) y los tamaños máximos de los
paquetes de datos. En la pestaña de
actualización, se determina el manejo de errores
en caso de falla en la carga. Finalmente, en la
pestaña de ejecución, se elige entre el modo
normal o de depuración. Estas configuraciones
permiten personalizar y controlar el proceso de
transferencia de datos, garantizando una carga
efectiva y eficiente en el sistema de destino.
PSA - Persistent Staging Area

Técnicamente: Es una tabla de base de datos en la que se almacenan los datos de la petición realizada a la
fuente de datos, por lo tanto se crea un PSA por fuente de datos y sistema fuente. Los datos llegan a la PSA
después de ejecutarse el InfoPaquete.

Funcionalmente: Representa una memoria inicial en SAP BI en la que los datos solicitados se graban sin
modificaciones desde el sistema fuente. A partir de SAP Netweaver 7.0 BI es necesario un paso en el proceso
ETL en casi todos los escenarios.

Para un buen uso de los PSA y evitar la sobrecarga del servidor se recomienda no mantener por más de 30
días los datos en la PSA.

Accediendo a la PSA

Transacción RSA1 - > seleccionar la fuente de datos. Clic derecho y seleccionar "Gestionar". seleccionar una
y el símbolo de la PSA . allí se podrán ver los datos subidos a BI en esa carga.

Carga de datos maestros de un sistema fuente SAP

Este sería un ejemplo de una carga de un Dato Maestro en SAP BI. Indica el Sistema Fuente, las Fuentes de
Datos que están conectadas a este Sistema Fuente y como pasan los datos a los Atributos y Textos del
cliente.

La manera de ver los Flujos de Datos de un determinado repositorio de datos es con clic derecho sobre el
objeto y seleccionando Display Data Flow ( Mostrar Flujo de datos)

Se recomienda que siempre se carguen los Textos antes que los Atributos.

Conceptos BI – BO - BW

SAP BI se encarga de recopilar y analizar los datos, SAP BO te ayuda a presentarlos de manera visualmente
atractiva y SAP BW es el sistema que almacena y gestiona todos los datos de manera ordenada.

SAP BI se centra en la presentación de datos y el análisis de indicadores clave, SAP BO proporciona


herramientas avanzadas para el análisis y la visualización de datos, y SAP BW es un almacén centralizado
para almacenar y organizar los datos empresariales.
SAP BI te proporciona informes resumidos para el análisis de datos, SAP BO te permite visualizar los datos
de manera intuitiva y SAP BW organiza y almacena los datos de tu empresa de manera eficiente para un
acceso rápido y fácil.

InfoSitio: Un InfoSitio es una estructura en SAP BI que proporciona una vista organizativa de los objetos y
contenidos relacionados. Sirve para agrupar y organizar los objetos de SAP BI en un lugar específico, como
una carpeta virtual, facilitando la navegación y el acceso a la información.

InfoObjeto: Un InfoObjeto es una entidad en SAP BI que almacena y define características o medidas
utilizadas para el análisis y la visualización de datos. Puede representar elementos como clientes, productos,
ventas o cualquier otro aspecto relevante para el negocio.

InfoFuente: Un InfoFuente es una conexión que establece la relación entre un objeto de origen de datos
externo y un objeto en SAP BI. Proporciona información sobre cómo extraer y cargar datos desde una fuente
externa a SAP BI.

Fuente de Datos: Una Fuente de Datos es la ubicación o sistema desde donde se extraen los datos para su
uso en SAP BI. Puede ser una base de datos, un archivo plano, un sistema externo u otras fuentes de
información.

Sistemas Fuente: Los Sistemas Fuente son los sistemas o aplicaciones externas que contienen los datos
que se utilizarán en SAP BI. Pueden ser sistemas de gestión empresarial (ERP), sistemas de ventas, sistemas
financieros u otras fuentes de datos externas.

La Fuente de Datos se refiere al lugar físico de donde provienen los datos, mientras que los Sistemas Fuente
son los sistemas o aplicaciones específicas que gestionan y proporcionan los datos desde esas fuentes. La
Fuente de Datos se enfoca en la ubicación física, mientras que los Sistemas Fuente se enfocan en los
sistemas y procesos que recopilan y almacenan los datos.

En resumen, un InfoSitio es una estructura de organización, un InfoObjeto es una característica específica


utilizada para el análisis, un InfoFuente es la conexión entre sistemas de datos, la Fuente de Datos es el lugar
físico de donde provienen los datos, y los Sistemas Fuente son los sistemas o aplicaciones que generan y
mantienen los datos. Todos estos elementos se relacionan entre sí para facilitar la organización, el análisis,
la carga y el acceso a los datos en SAP BI.

También podría gustarte