En ésta publicación explico el procedimiento para crear un repositorio de base de datos en PostgreSQL para la herramienta Spoon de Pentaho Data Integration (PDI)
Requisitos.-
1. Crear en PostgreSQL la base de datos PDI_REPO colocando como propietario al usuario postgres
Procedimiento.-
1. Ir al directorio de PDI. Por ejemplo: c:\pentaho\pdi-ce-4.3.0\data-integration
2. Ejecutar Spoon.bat para Windows o Spoon.sh para Unix
3. Hacer clic en el botón de agregar un nuevo repositorio
4. Seleccionar Kettle Database Repository
5. Hacer clic en el botón New para crear una conexión a la base de datos PDI_REPO
6. Definir el mismo nombre para los campos ID y Name
7. Hacer clic en el botón Create or Upgrade para crear la estructura de base de datos con la que trabaja Spoon en la base de datos PDI_REPO
8. Finalmente, hacer clic en el botón OK
¡Bienvenidos! En el presente blog comparto mis experiencias y conocimientos adquiridos sobre Data Warehousing, Open Source Business Intelligence, Data Engineering y tecnologías relacionadas con datos. Accede a la sección de "Sugerencias y Preguntas" si tienes comentarios o inquietudes, estaré gustoso en responderte.
Buscar en el Blog
martes, 29 de enero de 2013
Cómo configurar un repositorio de base de datos en PostgreSQL para Pentaho Data Integration
Labels:
base de datos,
metadatos,
PDI,
PDI_REPO,
PostgreSQL,
repositorio,
Spoon
Suscribirse a:
Comentarios de la entrada (Atom)
queria hacerte una consulta que herramientas necesito para realizar un datamart en pentaho pero desde base de datos postgres algun manual o algo que me podrias indicar no tengo mucho conocimiento de pentaho
ResponderBorrarLee las siguiente publicación para que tengas una idea de la plataforma Pentaho: http://ingmmurillo-dwh-bi.blogspot.com/2012/06/arquitectura-de-flujos-de-datos-con.html
BorrarSobre las herramientas puedes visitar http://ingmmurillo-dwh-bi.blogspot.com/p/kit-de-herramientas.html
Básicamente las herramientas que se usan son PDI para construir los ETLs, SQL Power Architect para modelamiento dimensional y las herramientas de construcción de soluciones de reporteo que pueden ser PRD, PSW o CDF.
Te sugiero la siguiente bibliografía:
Pentaho Solutions: Business Intelligence and Data Warehousing with Pentaho and MySQL
Pentaho Data Integration Beginner's Guide, Second Edition
hola, seguí todos los pasos pero cuando termino y le doy al botón "connect" se queda eternamente esperando ¿alguna solucion?
ResponderBorrar¿Qué versión de PostgreSQL estás usando y qué versión de JDK?
BorrarHola Buenas Tardes.
ResponderBorrarPrimera vez que trabajo con una herramienta ETL agradezco la ayuda.
Seguí los pasos pero al crear el repositorio sale le siguiente error:
Unable to insert new version log record into R_VERSION
Couldn't execute SQL: INSERT INTO R_VERSION VALUES(?, ?, ?, ?, ?)
ERROR: la columna «upgrade_date» es de tipo timestamp without time zone pero la expresión es de tipo boolean
Hint: Necesitará reescribir la expresión o aplicarle una conversión de tipo.
Position: 46
Muchas Gracias