El Data Warehousing consiste en el proceso de creación, recuperación y consolidación de datos de los sistemas fuente (bases de datos relacionales, archivos planos, Excel, Access, sistemas CRM, sistemas ERP, etc.) hacia un modelo de datos optimizado para actividades de análisis conocido como Data Warehouse (DWH).
El DWH se constituye en la principal fuente para las actividades de Inteligencia de Negocios (BI).
Las actividades del Data Warehousing conforman un conjunto de procesos interrelacionados que se conoce como Sistema de Data Warehouse / BI (DWH/BI).
El sistema de DWH/BI se encarga de obtener los datos de entrada, procesarlos a través de actividades de extracción, transformación y carga (ETL, Extract-Transform-Load) y cargarlos en el DWH con el objetivo que los usuarios del negocio tengan información para realizar actividades de BI.
Como todo sistema, el sistema DWH/BI requiere de una arquitectura, ésta arquitectura se la conoce como Arquitectura de Flujo de Datos.
Haciendo una analogía con los sistemas de software, éstos poseen arquitecturas monolíticas (stand-alone), cliente-servidor, 3 capas, N capas, etc. las cuáles definen ¿cómo? serán construídos los sistemas. La arquitectura de flujo de datos del sistema DWH/BI define ¿cómo? los datos serán transportados desde su fuente hacia su destino, el DWH.
La arquitectura de flujo de datos que se defina para el sistema de DWH/BI tiene una relación directa con los paradigmas propuestos por Bill Inmon y Ralph Kimball.
Así como los sistemas de software son construídos sobre plataformas tecnológicas como por ejemplo la plataforma Java, un sistema de DWH/BI es construído sobre una plataforma tecnológica conocida como Plataforma de Inteligencia de Negocios (BI Platform).
Entre las plataformas más conocidas están: Pentaho, SAP BusinessObjects, IBM Cognos, Oracle Hyperion, MicroStrategy
¡Bienvenidos! En el presente blog comparto mis experiencias y conocimientos adquiridos sobre Data Warehousing, Open Source Business Intelligence, Data Engineering y tecnologías relacionadas con datos. Accede a la sección de "Sugerencias y Preguntas" si tienes comentarios o inquietudes, estaré gustoso en responderte.
Buscar en el Blog
viernes, 18 de mayo de 2012
Data Warehousing
Labels:
Arquitectura de Flujo de Datos,
BI,
BI Platform,
Bill Inmon,
BusinessObjects,
Data Warehouse,
Data Warehousing,
DWH/BI,
Ecuador,
ETL,
Java,
Pentaho,
Plataforma,
Ralph Kimball,
sistema
Suscribirse a:
Comentarios de la entrada (Atom)
Excelente artículo!
ResponderBorrarLos negocios están pasando por un cambio fundamental en la manera en que se toman las decisiones.
En este mundo de mercado globalizados, la Inteligencia de Negocios, y la integración con el mundo digital a través de las aplicaciones empresariales, ya no es una opción, !es una necesidad!
Ing. buenos dias Soy Geovanny Reyes ex alumno suyo...
ResponderBorrarUna consultita rapida... que step puedo usar para eliminar campos duplicados en un mismo registro... es decir: tengo 3 telefonos: 022468578 - 0997514140 - 022468578 y al final me queden solo los 2: 022468578 - 0997514140
Muchas gracias de antemano
saludos