Buscar en el Blog

martes, 29 de enero de 2013

Cómo configurar un repositorio de base de datos en PostgreSQL para Pentaho Data Integration

En ésta publicación explico el procedimiento para crear un repositorio de base de datos en PostgreSQL para la herramienta Spoon de Pentaho Data Integration (PDI)

Requisitos.-

1. Crear en PostgreSQL la base de datos PDI_REPO colocando como propietario al usuario postgres

Procedimiento.- 

1. Ir al directorio de PDI. Por ejemplo: c:\pentaho\pdi-ce-4.3.0\data-integration
2. Ejecutar Spoon.bat para Windows o Spoon.sh para Unix
3. Hacer clic en el botón de agregar un nuevo repositorio



4. Seleccionar Kettle Database Repository



5. Hacer clic en el botón New para crear una conexión a la base de datos PDI_REPO




6. Definir el mismo nombre para los campos ID y Name



7. Hacer clic en el botón Create or Upgrade para crear la estructura de base de datos con la que trabaja Spoon en la base de datos PDI_REPO

8. Finalmente, hacer clic en el botón OK

5 comentarios:

  1. queria hacerte una consulta que herramientas necesito para realizar un datamart en pentaho pero desde base de datos postgres algun manual o algo que me podrias indicar no tengo mucho conocimiento de pentaho

    ResponderBorrar
    Respuestas
    1. Lee las siguiente publicación para que tengas una idea de la plataforma Pentaho: http://ingmmurillo-dwh-bi.blogspot.com/2012/06/arquitectura-de-flujos-de-datos-con.html

      Sobre las herramientas puedes visitar http://ingmmurillo-dwh-bi.blogspot.com/p/kit-de-herramientas.html

      Básicamente las herramientas que se usan son PDI para construir los ETLs, SQL Power Architect para modelamiento dimensional y las herramientas de construcción de soluciones de reporteo que pueden ser PRD, PSW o CDF.

      Te sugiero la siguiente bibliografía:
      Pentaho Solutions: Business Intelligence and Data Warehousing with Pentaho and MySQL
      Pentaho Data Integration Beginner's Guide, Second Edition

      Borrar
  2. hola, seguí todos los pasos pero cuando termino y le doy al botón "connect" se queda eternamente esperando ¿alguna solucion?

    ResponderBorrar
    Respuestas
    1. ¿Qué versión de PostgreSQL estás usando y qué versión de JDK?

      Borrar
  3. Hola Buenas Tardes.
    Primera vez que trabajo con una herramienta ETL agradezco la ayuda.
    Seguí los pasos pero al crear el repositorio sale le siguiente error:
    Unable to insert new version log record into R_VERSION

    Couldn't execute SQL: INSERT INTO R_VERSION VALUES(?, ?, ?, ?, ?)

    ERROR: la columna «upgrade_date» es de tipo timestamp without time zone pero la expresión es de tipo boolean
    Hint: Necesitará reescribir la expresión o aplicarle una conversión de tipo.
    Position: 46


    Muchas Gracias

    ResponderBorrar