Buscar en el Blog

jueves, 28 de mayo de 2015

Como activar el soporte para tipos de datos booleanos en PDI usando un Table Output

En ésta publicación explico el procedimiento para habilitar el soporte en Pentaho Data Integration para insertar datos booleanos (boolean). En sistemas operativos Windows al querer insertar en una columna de una tabla un campo que viene en el flujo como tipo Boolean lo intenta insertar como VARCHAR y se genera un error.

Para resolver éste inconveniente es necesario hacer lo siguiente:

1) Dentro de Spoon, ir a Tools > Repository > Explore
2) Ir a la pestaña de Connections y editar la conexión. Por defecto se muestra la categoría General
3) Ir a la categoría Advanced y marcar "Supports boolean data type"

miércoles, 13 de mayo de 2015

Arquitectura de Flujo de Datos con Pentaho Community Edition




En el siguiente diagrama que he creado muestro una Arquitectura de Flujo de Datos para cargar un Data Warehouse (DWH) apoyada por las herramientas de la plataforma Pentaho CE

Las actividades de Data Warehousing se realizan usando las herramientas de Pentaho Data Integration (PDI), Spoon es la herramienta gráfica para construir los procesos ETL,  Kitchen/Pan son las herramienta que permiten calendarizar la ejecución de los procesos ETL.

Las construcción de soluciones para actividades de Inteligencia de Negocios son apoyadas por las siguientes herramientas:
  • Pentaho Metadata Editor (PME) permite crear una capa de metadatos sobre el DWH con términos del negocio; ésta capa es la fuente para crear reportes a demanda usando herramientas como WAQR (Web-based Ad Hoc Query and Reporting)
  • Pentaho Report Designer (PRD) permite crear reportes avanzados que contienen fórmulas, agrupaciones, hipervínculos, parámetros, gráficos
  • Pentaho Schema Workbench (PSW) permite crear cubos de análisis OLAP
  • Community Tools (CTools) conjunto de herramientas Open Source que permiten construir tableros de mando (Dashboards) con indicadores claves de rendimiento (KPIs)

El servidor central Pentaho Server posee un cliente web conocido como Pentaho User Console (PUC) a través del cual se accede al contenido publicado por las herramientas PMEPRDPSW y CTools. Además, requiere de 3 repositorios para su operación normal:  hibernatequartzjackrabbit.

Requerimientos de Software y Hardware


Nuevas Funcionalidades