Diseño y Construcción del Almacén de Datos Código:  B2.335    Créditos:  4
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en que se proyecta   Conocimientos previos   Objetivos y competencias   Contenidos   Consulta de los materiales que dispone la asignatura   Materiales y herramientas de apoyo   Bibliografía y fuentes de información   Metodología   Información sobre la evaluación en la UOC   Consulta del modelo de evaluación   Evaluación Contínua   Evaluación final   Feedback  
Este es el plan docente de la asignatura para el segundo semestre del curso 2023-2024. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

Cada vez más el área de bases de datos está evolucionando por la aparición de nuevos retos en la gestión de la información, entre ellos los Almacenes de datos o Data Warehouse (DW)  como elemento troncal de la Factoría de Información Corporativa (FIC).

La FIC/DW es hoy en día el centro de atención de las grandes instituciones, porque proporciona un mejor conocimiento de dicha organización y de sus clientes.

La creación de la FIC y la correcta implementación de todos sus elementos tales como los diferentes almacenes de datos, los datos maestros, las estructuras multidimensionales y los procesos de transformación y carga son cuestiones críticas en la gestión del conocimiento y la madurez analítica de las organizaciones. En la creación de la FIC es también fundamental prestar especial atención a las cuestiones relativas a la calidad del dato, gestión de los metadatos y la gestión de los datos maestros. De igual modo y dada la envergadura de los proyectos relacionados con la creación de la FIC, conviene conocer las distintas estrategias y enfoques existentes de cara a abordar estos proyectos.

Amunt

El programa de "Inteligencia de negocio y Big Data", al cual pertenece esta asignatura, se compone de varios itinerarios y especializaciones. Esta asignatura pertenece a la especialización Sistemas de Inteligencia de negocio junto con otras dos asignaturas: "Bases de datos para Data Warehouse" y "Explotación y Administración de Sistemas de Data Warehouse".

Esta asignatura, Diseño y Construcción del Almacén de Datos, como su nombre indica se centra en los almacenes de datos, que son en realidad bases de datos diseñadas y construidas para ofrecer apoyo en la toma de decisiones de las organizaciones.

Un Almacén de datos, se crea al extraer datos desde una o más aplicaciones institucionales y/o fuentes externas de datos. Los datos extraídos, antes de cargarse en el almacén de datos, son transformados para eliminar inconsistencias, y si es necesario, resumirlos. Este proceso de transformación, de creación del detalle de los datos (incluyendo el factor tiempo), el resumen y combinación de los datos extraídos, ayudan a crear un contexto adecuado para que cualquier persona de la institución pueda tomar las decisiones que le correspondan de la manera más responsable posible. Por lo tanto, influye directamente en la mayor eficacia del negocio.

Las líneas comerciales actuales y futuras obligan a las empresas a ser cada vez más competitivas. Para ser competitivas es necesario que las compañías tengan optimizados e integrados sus flujos internos de información y sus relaciones comerciales externas, y así conseguir objetivos básicos como son las mejoras de la productividad, la calidad, el servicio al cliente y la reducción de costes.

Para llevar a cabo todos estos propósitos hacen falta profesionales que tengan conocimientos profundos en estas áreas. En consecuencia, y dada la emergencia de todos los temas relacionados con Internet, se puede afirmar que el área de interés presentada forma un bloque innovador dentro del mundo de los sistemas de información.

Amunt

Inteligencia de negocio, gestión de bases de datos, analítica de negocio, social-intelligence y Big Data.

Amunt

El Especialista en Sistemas de Inteligencia de Negocio, debe estar familiarizado con los conceptos básicos de Business Intelligence y análisis de datos. Preferiblemente debe de haber cursado las especializaciones correspondientes del máster dedicadas a estos bloques temáticos o en su defecto disponer de los conocimientos que se imparten en ellos

Amunt

Esta asignatura pretende que, al final de la misma, el estudiante haya adquirido las siguientes competencias:

  • Saber diseñar un almacén de datos, elegir la mejor arquitectura que lo soporte y saberlo administrar.
  • Conocer los diferentes tipos de aplicaciones y herramientas para una óptima explotación del almacén de datos (EIS, OLAP).
  • Saber elegir las mejores técnicas para extraer información del almacén de datos, lo que servirá para llegar a conclusiones importantes que permitirán emprender un nuevo plan de acción que lleve a la empresa a ser más competitiva.
  • Saber analizar el entorno de negocio de la empresa: qué módulos funcionales necesitarían, como debería ser la arquitectura del sistema, qué bases de datos se deberían compartir, tipos de interfaz, etc.
  • Saber cómo deben implementarse procesos de negocio de alto nivel en las empresas para que proporcionen un rendimiento competitivo.
  • Ser capaz de proponer soluciones integradas y lograr hacer entender a los clientes que la implantación de un ERP es un proyecto complejo debido a su profundo impacto en los procesos de la empresa (cambio cultural de la empresa, cambio en los procesos de negocio, cambio en la organización y cambio en la disciplina de trabajo).
  • Adquirir los conocimientos necesarios para seleccionar de manera adecuada proveedores y productos teniendo en cuenta la problemática de la empresa.

Todas estas competencias específicas están relacionadas con las competencias generales de la especialización Bases de datos, data minning y data Warehouse siguientes:

  • Conocer las diferentes estructuras de datos que ofrecen soporte a los procesos de BI.
  • Conocer las principales herramientas relacionadas con los procesos de BI y saber utilizar alguna.
  • Ser capaz de diseñar e implementar esquemas de almacenes de datos orientados a procesos analíticos.
  • Ser capaz de poblar los almacenes de datos desde bases de datos operacionales utilizando procesos ETL.
  • Ser capaz de crear i explotar almacenes de datos para buscar información utilizando técnicas de minería de datos y almacenes de datos.

Amunt

La asignatura consta de los siguientes módulos:

  • El módulo 1, Introducción al Data Warehouse, presenta los almacenes de datos por comparación con los sistemas de base de datos operacionales. También introduce el concepto de la FIC (Factoría de Información Corporativa) y presentan cada uno de los elementos que la componen.
  • El módulo 2, La construcción de la FIC, define las posibles estrategias de construcción del sistema. Se detallan los pasos para la construcción de los almacenes de datos y de componente de transformación e integración.
  • El módulo 3, Diseño Multidimensional, presenta las herramientas OLAP como mecanismo de acceso a la Factoría de Información. Estas herramientas es basan en el concepto de multidimensionalidad. Comprender las principales características de los sistemas multimensionales, así como, comprender cómo realizar los diseños conceptuales, lógicos y físicos de la factoría de información serán los puntos fundamentales del módulo.
  • El módulo 4, Gestión de datos en un Data Warehouse, aborda cuestiones como la calidad de los datos, la gestión de los datos maestros, gestión de los metadatos y el gobierno del dato.

Amunt

Material Soporte

Amunt

Otros materiales adicionales estarán disponibles en el aula a medida que vayan siendo necesarios en el desarrollo del curso.

Aparte de esto, se proporciona una imagen virtual alojada en AWS (Amazon Web Services) con todo el software necesario para el curso preconfigurado:

  • Sistema operativo: Windows Server 2008 32bits
  • Base de datos: Oracle 11g XE 32 bits
  • Microsoft SQL Analysis Services 2012 32bits
  • Pentaho Data Integration 6.1
  • SQL Developer 4.1.2

Amunt

  • Devlin, Barry (1997). Data warehouse : from architecture to implementation / Barry Devlin. Massachusetts : Addison-Wesley, cop. 1997
    ISBN: 0201964252
  • Inmon, William H. (2005). Building the data warehouse / W.H. Inmon. New York : J. Wiley,, cop. 2005
    ISBN: 0764599445
  • Inmon, William H. (1999). Building the operational data store / W.H. Inmon. New York [etc.] : John Wiley & Sons, cop.1999
    ISBN: 047132888X
  • Inmon, William H. (2001). Corporate information factory / W.H. Inmon, Claudia Imhoff, Ryan Sousa. New York : John Wiley, cop. 2001
    ISBN: 0471399612
  • Inmon, William H. (1994). Using the data warehouse / W.H. Inmon, R. D. Hackathorn. New York : J. Wiley,, cop. 1994
    ISBN: 0471059668
  • Kimball, Ralph (2002). The Data warehouse toolkit : the complete guide to dimensional modeling / Ralph Kimball, Margy Ross. New York : Wiley, cop. 2002
    ISBN: 0471200247
  • Inmon, W.H., Strauss, Derek, Neushloss, Genia (2010). DW 2.0: The Architecture for the Next Generation of Data Warehousing (Morgan Kaufman Series in Data Management Systems)
    ISBN: 0123743192
  • Ladley, Jhon. Data Governance: How to Design, Deploy and Sustain an Effective Data Governance Program (2011 The Morgan Kaufmann Series on Business Intelligence)
    ISBN: 0124158293

Amunt

El profesor colaborador guiará y orientará el estudio a través del Tablón del aula para que se pueda hacer un buen seguimiento de la asignatura.

También responderá las dudas que vayan surgiendo en el Foro del aula, así como las consultas y comentarios que se envíen a su buzón personal.

Dado que los contenidos tienen un importante componente práctico, su aprendizaje se hará a partir del desarrollo de un caso práctico, de realización obligatoria, que se realizará a lo largo del semestre. Hay que tener presente que este caso práctico es de gran importancia en la evaluación de la asignatura y, por tanto, hay que respetar todos los plazos de entrega que se establezcan.

También se realizarán pruebas de evaluación continua (PEC) para ayudar a consolidar los conocimientos adquiridos y a comprobar el nivel de aprendizaje alcanzado.

Aparte del caso práctico, el trabajo de la asignatura se propone llevar a cabo en cinco fases:

  • Lectura y asimilación de los contenidos de los módulos didácticos, durante esta fase será muy interesante plantear todo tipo de consultas en el Foro.
  • Realización de los ejercicios de autoevaluación que hay al final de los módulos didácticos, o de otros que presente el profesor colaborador, comprobando su solución con la aportada por el libro o el profesor colaborador.
  • Lectura de la documentación correspondiente a las herramientas Oracle y Microsoft SQL Server Analysis Services con el objetivo de ver cómo se ha realizado una implementación del concepto.
  • Resolver las cuestiones teóricas presentadas en las PECs.
  • Aplicar la teoría a la realización de las prácticas, con lo que se podrá comprobar la implementación real de los conocimientos teóricos adquiridos.

Uso del Campus

Se utilizarán los buzones del Campus Virtual como mecanismo básico de comunicación entre todos los miembros del aula. Los enunciados y una solución de las PEC y las prácticas se publicarán en el apartado de Planificación del aula en la fecha que corresponda en el calendario. Los estudiantes deberán entregar las soluciones de las PEC en el buzón Entrega y registro de EC del apartado de Evaluación del aula.

Para favorecer la comunicación entre todos nosotros, se recomienda utilizar el Foro del aula para plantear y resolver cualquier tipo de duda. Hay que tener en cuenta que generalmente la duda de un estudiante suele ser duda de varios y que utilizando un espacio de comunicación común, se aprenderá más y mejor. Los materiales complementarios de la asignatura se pueden encontrar en el espacio Recursos del aula.

Amunt

La Normativa académica de la UOC dispone que el proceso de evaluación se fundamenta en el trabajo personal del estudiante y presupone la autenticidad de la autoría y la originalidad de los ejercicios realizados.

La falta de originalidad en la autoría o el mal uso de las condiciones en las que se hace la evaluación de la asignatura es una infracción que puede tener consecuencias académicas graves.

El estudiante será calificado con un suspenso (D/0) si se detecta falta de originalidad en la autoría de alguna actividad evaluable (práctica, prueba de evaluación continua (PEC) o final (PEF), o la que se defina en el plan docente), ya sea porque ha utilizado material o dispositivos no autorizados, ya sea porque ha copiado de forma textual de internet, o ha copiado de apuntes, de materiales, manuales o artículos (sin la citación correspondiente) o de otro estudiante, o por cualquier otra conducta irregular.

La calificación de suspenso (D/0) en la evaluación continua (EC) puede conllevar la obligación de hacer el examen presencial para superar la asignatura (si hay examen y si superarlo es suficiente para superar la asignatura según indique este plan docente).

Cuando esta mala conducta se produzca durante la realización de las pruebas de evaluación finales presenciales, el estudiante puede ser expulsado del aula, y el examinador hará constar todos los elementos y la información relativos al caso.

Además, esta conducta puede dar lugar a la incoación de un procedimiento disciplinario y la aplicación, si procede, de la sanción que corresponda.

La UOC habilitará los mecanismos que considere oportunos para velar por la calidad de sus titulaciones y garantizar la excelencia y la calidad de su modelo educativo.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.


Ponderación de las calificaciones

Opción para superar la asignatura: EC

Nota final de asignatura: EC

Amunt

En esta asignatura el objetivo principal es que el estudiante, a partir de una serie de conocimientos teóricos, pueda realizar aplicaciones eminentemente prácticas dentro del ámbito del Data Warehousing, sin perder en ningún momento la perspectiva de negocio. Con esta finalidad se plantean dos tipos de actividades: las PEC, que permiten comprobar el nivel de comprensión de los conceptos estudiados, y la práctica, que presenta un caso práctico a resolver sobre un gestor comercial de base de datos y un sistema comercial OLAP y MOLAP.

La primera PEC consistirá básicamente en la toma de contacto con las herramientas que se utilizarán a lo largo del curso. La segunda PEC, basada en buena parte en aspectos teóricos, debe permitir profundizar en la comprensión del material por parte del estudiante, las cuestiones se centrarán en la correcta comprensión de los distintos componentes de la FIC y en el proceso de construcción de la misma, así como en los distintos enfoques y estrategias para su correcta implementación.

Práctica

Las prácticas tratan sobre un mismo caso práctico y se dividen en 3 partes . Cada parte de ellas se entrega por separado y el plazo para realizarla suele ser de unas dos/tres semanas (ver la planificación de la asignatura). Para aprobar la evaluación continua será condición necesaria haber presentado cada una de las actividades dentro de los plazos establecidos y obtener una calificación mínima de C+. El objetivo es construir un Data Warehouse en base a los datos de un caso práctico.

Una vez evaluada cada parte , el profesor colaborador colgará en su tablero UNA solución válida (de las muchas posibles) y comunicará a sus alumnos su calificación. A grandes rasgos el caso práctico, que se descompone en tres prácticas, nos permitirá desarrollar las siguientes habilidades:

  • Practica 1: Análisis funcional de los requerimientos dados. Identificación de los elementos de análisis (indicadores, dimensiones, atributos). Análisis del archivo operacional proporcionado (fuentes de datos) Estudio y realización del diseño conceptual y físico del modelo. multidimensional. Construcción del almacén de datos que dará soporte a los requerimientos proporcionados.
  • Practica 2: Diseño y construcción de los procesos de extracción, transformación y carga de datos desde el sistemas operacionales hacia el almacén de datos.
  • Practica 3: Creación de un cubo multidimensional partiendo de la información disponible en el Data Warehouse

Hay que validar el software a utilizar (Pentaho Data Integration, Oracle y Microsoft SQL Server Analysis Services). Estas acciones habrán sido realizadas en la PEC 1 con el apoyo de la documentación que se le entregará.

En todas las actividades entregadas, indicar explícitamente qué fuentes se han utilizado en la preparación de la entrega, aportando información para localizar el recurso: URL, datos bibliográficos, etcétera.

Tal y como se ha comentado en el apartado Metodología, el profesor colaborador le guiará y orientará en el estudio a través del Tablón del aula para que pueda hacer un buen seguimiento de la asignatura. También responderá las dudas que vayan surgiendo en el Foro del aula, así como las consultas y comentarios que se envíen a su buzón personal. Sin embargo, se recomienda el uso del Foro del aula para plantear dudas sobre los contenidos de la asignatura y/o resolución de actividades. De esta manera el profesor colaborador responde la misma duda una única vez y se promueve la discusión sobre temas de interés entre compañeros, lo cual favorece el aprendizaje colectivo. Además, el profesor colaborador realizará un seguimiento personalizado de la evaluación continua, revisará todas las PEC y prácticas entregadas y comentará de forma cualitativa a nivel grupal y/o individual la resolución mediante la aplicación de calificaciones. Estos comentarios le ayudarán a progresar en su aprendizaje. 

Conviene insistir en que el modelo de evaluación de esta asignatura está basado en la evaluación continua y que por tanto, es fundamental llevar a cabo las actividades de evaluación que se planteen durante el curso y realizarlas en el plazo establecido (recordemos que en el caso práctico la solución de una actividad forma parte del enunciado de la siguiente). Si en algún caso puntual, no pudiera realizarse alguna entrega por una causa mayor; previa comunicación y justificación documentada al profesor colaborador, el profesor de la asignatura podría considerar el caso de excepcional y ofrecer al estudiante, en la medida de lo posible, una vía alternativa para poder calificar dicha actividad.

Amunt

Dado el carácter eminentemente práctico de esta asignatura, el peso más importante de la nota final lo tendrán las prácticas, las PECs permitirán mejorar (sólo penalizan en el caso de tenerlas suspendidas). La nota final de la asignatura vendrá determinada por la siguiente tabla de calificaciones:

PEC ®
Práctica
¯
A
B
C+
C-
D
N
A
A
A
B
C-
D
D
B
B
B
B
C-
D
D
C+
B
C+
C+
C-
D
D
C-
C-
C-
C-
C-
D
D
D
D
D
D
D
D
D
N
D
D
D
D
D
N

La nota final de la práctica se calculará teniendo en cuenta las notas de las tres fases de la práctica, teniendo en cuenta los siguientes pesos: Fase 1 (40%), Fase 2 (40%) y Fase 3 (20%). Y la nota final de la PEC se obtendrá a partir de las notas de la PEC1(50%) y la PEC2 (50%).

Importante: El seguimiento correcto de la asignatura os compromete a realizar las actividades propuestas (PECs y prácticas) de manera individual y según las indicaciones que pauta este Plan Docente. En caso de que no sea así, las actividades se os evaluarán con una D. Por este motivo no puede enviar, en ningún caso, a otros compañeros del aula la resolución de la actividad durante el período de entrega. Por otra parte, y siempre a criterio de los Estudios, el incumplimiento de este compromiso puede suponer que no se le permita superar ninguna otra asignatura mediante evaluación continuada ni en el semestre en curso ni en los siguientes.

Es responsabilidad del estudiante, asegurarse de que los documentos entregados se han colgado correctamente y que corresponden a las actividades que hay que presentar.

Amunt

Se le hará tres tipos de retorno sobre las actividades evaluables entregadas :

  • Retorno general: consiste en la publicación de una posible solución oficial (con explicaciones, en caso de que éstas sean necesarias ) para las actividades evaluables propuestas (PEC y PRA). Este tipo de retorno siempre se realizará. La publicación de las soluciones oficiales se realizará después de fecha límite de entrega fijada por los estudiantes (en general, un par de días después).
  • Retorno a nivel de grupo: consiste en la publicación (vía tablero o conjuntamente con la solución oficial de las actividades evaluables ) de los errores más frecuentemente realizados por los estudiantes. Este tipo de retorno sólo se realizará en caso de ser pertinente, una vez que el equipo docente haya finalizado el proceso de corrección.

  • Retorno individualizado: consiste en la realización de comentarios individuales sobre las entregas realizadas por los estudiantes de las actividades evaluables. Este tipo de retorno siempre se realizará y hará mediante el registro de evaluación continua. En el caso de que la petición sea realizada por el estudiante, será necesario que el estudiante argumente, una vez consultada la solución oficial, los motivos por los que cree que sus soluciones son correctas.

Amunt