viernes, 1 de junio de 2012

INTELIGENCIA DE NEGOCIO

Estudiando la definición de inteligencia de negocio se encuentra que se refiere al conjunto de herramientas y estrategias enfocadas a la administración y creación de conocimiento mediante el análisis de datos existentes en una organización o empresa, la cual se basa en aplicaciones, tecnologías y procesos de recolección, almacenamiento y presentación de los datos, permitiendo su transformación en información para ayudar a los usuarios a tomar mejores decisiones.

Entre éstas herramientas se encuentran los sistemas de informacion ejecutiva (EIS por sus siglas en ingles Executive information systemorientados a usuarios de nivel gerencial, que permite monitorear el estado de las variables de un área o unidad de la empresa a partir de información interna y externa a la misma. Una de las características más importantes de un EIS es que permite a usuarios con perfil no técnico construir nuevos informes y navegar por los datos de la compañía, con el objetivo de descubrir información que les resulte relevante.

Características de inteligencia de negocio

Rapidez: los datos son "empujados" o fácilmente accedidos. Existencia de data correcta, en el momento correcto, en el lugar apropiado y en el formato necesitado.

Integradora: incorporación de datos de una gran variedad de fuentes, sistemas y aplicaciones. Provisión de una vista holística.

Precisa: decisiones basadas en datos precisos, es decir, realidades + intuición + experiencia = preciso.

On-Line Analytic Processing (OLAP)

En inteligencia de negocio surge la estrategia de procesamiento analítico en linea (OLAP por sus siglas en ingles) como enfoque para proveer rápidamente respuestas a consultas analíticas que son de naturaleza multidimensional, es decir, agilizar la consulta de grandes cantidades de datos mediante cubos OLAP que contienen datos resumidos de grandes bases de datos o sistemas transaccionales (OLTP).

OLAP se basa en el concepto de sistema de soporte a decisiones (DSS por sus siglas en ingles: decision support system) el cual es un sistema informático utilizado para servir de apoyo, más que automatizar, en el proceso de toma de decisiones. El apoyo a una decisión significa ayudar a las personas que trabajan solas o en grupo a reunir inteligencia, generar alternativas y tomar decisiones a través de la estimación, la evaluación y/o la comparación de alternativas.

Características de OLAP

- Enfoque a la información: diseñado para la investigación por parte de usuario final y la exploración de la data.



- Interactividad: capacidad de aceptar y actuar sobre preguntad ad-hoc que el usuario tenga.



- Agregación dinámica: información resumida de data detallada en tiempo real.



- Navegación (Drilling): posibilidad de moverse entre niveles de granularidad de datos.



- Segmentación (Slice and Dice): habilidad de combinar y recombinar varias dimensiones para visualizar diferentes facetas de la información.


 
SLICING

DICING


- Pivoteo: capacidad de ofrecer comparaciones, revelar patrones y relaciones y analizar tendencias.



- Desempeño: el acceso a la data y las manipulaciones deben realizarse a la "velocidad del pensamiento".



ARQUITECTURA CONCEPTUAL DE INTELIGENCIA DE NEGOCIO

A continuación un esquema detallado donde se representa de manera conceptual la arquitectura de las soluciones analíticas de inteligencia de negocio: 


- OLTP: Procesamiento de Transacciones En Línea (OnLine Transaction Processing), son sistemas que facilitan y administran aplicaciones transaccionales, usualmente para entrada de datos y recuperación y procesamiento de transacciones, por ejemplo, CRMs y ERPs como aplicaciones operacionales, en el esquema se quiere representar la data sin refinar, bajo nivel de transacción y normalizada en 3FN.

- ETL: extraer, transformar y cargar (Extract, Transform and Load), consiste en el proceso que permite mover datos desde múltiples fuentes, reformatearlos y limpiarlos, para luego cargarlos en otra base de datos o data warehouse para analizar, o en otro sistema operacional para apoyar un proceso de negocio. Se efectúa desde múltiples orígenes hacia un solo repositorio.

- ODS/Staging: Almacén de datos operacionales (Operational Data Store), consiste en el almacenamiento centralizado de datos consumido por los Data Warehouse así como también otros sistemas OLTP; la data cumple con 3FN. Staging se refiere al área de trabajo o área de procesamiento temporal transitoria donde se ubican los archivos, bases de datos, etc para ETL, por ejemplo: archivos de texto en proceso, archivos comprimidos, XML, scripts FTP.

- Data Warehouse Systems: es la data histórica o expediente completo de una organización, más allá de la información transaccional y operacional, almacenado en una base de datos diseñada para favorecer el análisis y la divulgación eficiente de datos el cual es integrado, no volátil y variable en el tiempo, cumple con 3FN.

- OLAP Server: en este se ubica el procesamiento analítico en linea donde se efectúan los cálculos analíticos agregados y sumarizados, por ejemplo: Primer trimestre Vs. Ultimo trimestre. En este punto la data se encuentra masivamente desnormalizada.

- OLAP Client: es el usuario visualizador de la data ya procesada y disponible para ser consultada, de modo que puede ser vista en tablas pivote, realizar navegación, drilling, etc, con el fin de generar consultas y mostrar resultados. En estos procesos se intercambia metadata con el servidor OLAP.

MODELAJE DIMENSIONAL

El modelaje dimensional se basa en mejores practicas para el diseño de bases de datos para OLAP. Es una técnica de modelaje y no implementacion de base de datos, dicha técnica optimiza agregaciones masivas y dinámicas de datos. En el modelaje dimensional surge el esquema estrella.

Esquema Estrella

Es un modelo de datos que tiene una tabla de hechos (tabla fact) que contiene los datos para el análisis, rodeada de las tablas de dimensionesLas tablas de dimensiones tendrán siempre una clave primaria simple, mientras que en la tabla de hechos, la clave principal estará compuesta por las claves principales de las tablas dimensionales.



Una tabla fact o de hechos contiene elementos (hechos) que se quieren medir siendo estas medidas valores que se tratan de reportar: el Que, por ejemplo: ingreso, cantidad vendida (unidades), precio promedio, etc.

Las tablas dimensiones son las formas como se quieren ver las medidas, por ejemplo: por fecha, por producto, etc. Éstas tablas dan contexto, significado a la información en los reportes: el Por.

Expongo un ejemplo de lo anterior desde un enfoque de lenguaje:

Sepamos "el Que" son los hechos y "el Por" las dimensiones, entonces el usuario desea:

- Saber cuales son las proporciones de ventas por tipos de producto y tipos de cliente.
- Cual es la proporción de ganancia que proviene de clientes actuales vs. clientes nuevos.
- Cual es el perfil de los clientes (localidad, ingreso y genero) que hace el 80% de la ganancia actual opuesto al 80% de los ingresos.

Finalmente dicho usuario obtendrá un reporte de la siguiente manera: