Bases de Datos para Data Warehouse Código:  B2.336    Créditos:  4
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en que se proyecta   Conocimientos previos   Objetivos y competencias   Contenidos   Consulta de los materiales que dispone la asignatura   Materiales y herramientas de apoyo   Bibliografía y fuentes de información   Metodología   Información sobre la evaluación en la UOC   Consulta del modelo de evaluación   Evaluación Contínua   Evaluación final   Feedback  
Este es el plan docente de la asignatura para el segundo semestre del curso 2023-2024. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

Las bases de datos son el mecanismo más habitual que las organizaciones utilizan para almacenar y procesar de manera no volátil los datos necesarios para su actividad diaria. A su vez, las bases de datos son gestionadas y manipuladas mediante un software altamente especializado y complejo denominado sistema gestor de bases de datos. Desde un punto de vista de uso, las bases de datos nos permiten gestionar el día a día de las organizaciones y por ello también se las conoce bajo la denominación de bases de datos operacionales. Por otro lado, tenemos los almacenes de datos (data warehouse) que integran datos de diferentes fuentes, entre las que se encuentran las bases de datos operacionales, y que tienen como objetivo principal dar apoyo a la toma de decisiones.

Para poder guardar los datos de interés de una organización, hay que disponer de algún modelo de datos que permita su representación en un ordenador en forma de bases de datos. Este modelo de datos tiene que permitir, por un lado, definir la estructura de la base de datos y las reglas de integridad que garantizan que la base de datos sea consistente. Por otro lado, el modelo de datos también tiene que proporcionar operaciones que permitan la consulta y actualización de la base de datos. A pesar de que existen diferentes modelos de datos, nosotros nos centraremos en el modelo de datos relacional, dado que es el más utilizado.

Esta  asignatura tiene por objetivo adquirir conceptos, procedimientos y buenas prácticas para la creación y manipulación de las bases de datos que dan soporte a la construcción de almacenes de datos. Para ello se profundiza en el aprendizaje del lenguaje SQL, extendiéndolo mediante el estudio del lenguaje procedimental PL/pgSQL, y en el diseño físico de bases de datos, así como en bases de datos orientadas a columnas. Estas bases de datos también se basan en el modelo relacional y se caracterizan por el almacenamiento de los datos en forma de columnas. Esta característica las hace especialmente idóneas para entornos OLAP.

Amunt

Esta asignatura, en el contexto de los diferentes programas formativos de Business Intelligence, forma parte de la especialidad de Sistemas de información de inteligencia de negocio (data warehouse). En esta especialidad se adquieren las competencias para diseñar, construir, mantener y explotar los sistemas de información de inteligencia de negocio más habituales, es decir, los que se basan en el uso de bases de datos relacionales para la construcción de un almacén de datos o data warehouse. Esta especialidad incluye, además de la asignatura objeto de este plan docente, las siguientes asignaturas:

  • Diseño y construcción del almacén de datos, donde se aprende a crear un almacén de datos adecuado que ofrezca soporte en la toma de decisiones de la organización. Se presenta a nivel conceptual la arquitectura de almacenamiento de un sistema de Business Intelligence para data warehousing y se dan pautas para la construcción de este tipo de sistemas.
  • Explotación y administración de sistemas de data warehouse, donde se aprende a evaluar la viabilidad de la construcción de un almacén de datos y a explotar y administrar sistemas de data warehouse. Con este fin se presentan las distintas formas de presentar los datos y qué tipos de  herramientas pueden ofrecer el tipo de visualización que interesa. Asimismo se enseña a administrar el  sistema durante su desarrollo, implantación y/o posterior explotación de los datos.

Amunt

El objetivo de la especialidad de Sistemas de información de inteligencia de negocio (data warehouse) es formar aquellos perfiles tecnológicos (diseñadores, analistas, programadores, configuradores y responsables de los servicios técnicos) que componen las soluciones de Inteligencia de negocio: bases de datos, almacenamiento, extracción, tratamiento y carga de datos, construcción de aplicaciones de usuario, etc.

En concreto, en el caso de esta asignatura, los campos profesionales en los que se proyecta son "Programador SQL", "Programador de Sistemas de BI", "Consultor de Proyectos BI" y "Desarrollador ETL".

Amunt

Esta especialidad se dirige a perfiles técnicos e ingenieros informáticos o de telecomunicación, analistas de datos en departamentos de control de gestión u otros, matemáticos o candidatos con una experiencia profesional equivalente.

Son deseables conocimientos básicos en bases de datos relacionales, en concreto, en los principios teóricos sobre los que se sustentan este tipo de bases de datos, y las características del software especializado que las gestiona (el sistema gestor de bases de datos). En el caso de tener dificultades con los contenidos de los bloques didácticos, el equipo docente podrá proporcionar materiales adicionales para nivelar los conocimientos del estudiante.

Amunt

Las principales competencias que el estudiante tiene que adquirir en el contexto de la asignatura son las que se indican a continuación:

  • Ser capaz de consultar y actualizar de manera eficiente una base de datos mediante SQL estándar.
  • Ser capaz de codificar procedimientos almacenados utilizando lenguajes procedimentales.
  • Ser capaz de implementar diferentes técnicas de disparadores en una base de datos.
  • Ser capaz de entender y aplicar conceptos avanzados de SQL como funciones analíticas, transacciones o Common Table Expression.
  • Ser capaz de realizar el diseño físico de bases de datos relacionales.
  • Conocer las características de las bases de datos orientadas a columnas, y saberlas situar en el contexto del área de bases de datos.
  • Entender las principales técnicas que implementa un sistema gestor de bases de datos orientado a columnas.
  • Ser capaz de aplicar los conocimientos anteriores dentro del contexto del data warehouse/OLAP.

Amunt

La asignatura consta de 5 bloques didácticos, cuyo contenido se detalla a continuación:

Bloque 1. El lenguaje SQL: introducción

En este bloque didáctico se presentan los conceptos más básicos asociados al SQL estándar. En primer lugar se presentan las principales sentencias de definición de datos (cómo seria, por ejemplo, tablas y vistas). A continuación se presentan las sentencias básicas de manipulación de datos (SELECTINSERTDELETE y UPDATE de tablas y vistas). Finalmente, se introducen las sentencias de concesión y revocación de privilegios sobre los datos, primitivas de gestión de transacciones, y otras modalidades de trabajo con el lenguaje SQL.

Los materiales principales que se utilizarán en este bloque didáctico serán: el módulo didáctico "El lenguaje SQL I", y dos series de vídeos muy importantes: convenciones de nombres y buenas prácticas en SQL, focalizándose esta última serie en las buenas prácticas de codificación en SQL y generación de consultas. Estos materiales se complementan con las transcripciones de cada uno de los vídeos de las series y un documento con la convención de nombres a seguir durante la asignatura.

Bloque 2. El lenguaje SQL: procedimientos y disparadores

En este bloque didáctico se presentan los conceptos más avanzados asociados al SQL estándar. En primer lugar, se presenta la estructura básica de componentes de un entorno SQL, revisando los conceptos de servidores, catálogos y esquemas, para continuar una introducción a los conceptos de conexión, sesión y transacción. A continuación, se completará el estudio de los componentes lógicos vistos mediante la introducción de procedimientos almacenados y disparadores. Finalmente, se introducen el lenguaje procedimental PL/pgSQL y las sentencias que ofrece PostgreSQL para definir estos componentes.

Los materiales principales que se utilizarán en este bloque didáctico serán: el módulo didáctico "El lenguaje SQL II", la serie de vídeos de buenas prácticas en SQL, focalizándose ésta en las buenas prácticas de codificación de procedimientos almacenados, y dos vídeos que contextualizarán los procedimientos y disparadores en el marco de las bases de datos operacionales y del data warehouse. Estos materiales se complementan con las transcripciones de cada uno de los vídeos de las series y con un documento de complementos de SQL para la codificación de procedimientos almacenados.

Bloque 3. Complementos de SQL

En este bloque didáctico se presentan conceptos avanzados de SQL de aplicación en entornos Data Warehouse. En primer lugar, se presenta el concepto de clave subrogada y las diferentes posibilidades de implementar esta técnica mediante SQL. A continuación, se introducirán dos conceptos avanzados para la creación de consultas SQL, las Common Table Expression y las funciones analíticas, cómo aplicar estas funcionalidades y los beneficios asociados. Por último, se verán técnicas de tratamiento de valores nulos en bases de datos operacionales y Data Warehouse, y se concluirá con una introducción a las transacciones, sus propiedades, la problemática asociada a éstas, mecanismos de implementación de transacciones en PostgreSQL y la importancia de éstas en entornos de bases de datos operacionales y Data Warehouse.

Los materiales principales que se utilizarán en este bloque didáctico serán: el módulo didáctico "Complementos de SQL" y la serie de vídeos de buenas prácticas en SQL, focalizándose en las buenas prácticas de codificación de transacciones. Estos materiales se complementan con las transcripciones de cada uno de los vídeos de la serie.

Bloque 4. Introducción al diseño físico de bases de datos

Este bloque didáctico analizará los principales métodos y construcciones que se utilizan en el diseño físico de bases de datos. Conceptualmente, podemos definir el diseño físico de una base de datos como el proceso que, a partir del diseño lógico de la base de datos y de información sobre su uso esperado, creará una configuración física de la base de datos adaptada al entorno donde se alojará y que permita el almacenamiento y la explotación de los datos con un rendimiento adecuado.

Los materiales principales que se utilizarán en este bloque didáctico será el módulo didáctico "Introducción al diseño físico de bases de datos".

Bloque 5. Bases de datos orientadas a columnas

Este bloque didáctico presentará las principales características y utilidad de las bases de datos orientadas a columnas (más habitualmente conocidas como column stores), así como las diferencias que presentan con las bases de datos relacionales más tradicionales (denominadas row stores). Asimismo se explicarán las principales técnicas que permiten implementar dichas características. Finalmente se proporcionará una visión de los principales productos disponibles en el mercado.

Los materiales que se utilizarán serán vídeos y sus apuntes correspondientes.

Amunt

Material Soporte
Convención de nombres: Componentes Audiovisual
Convención de nombres: Convenciones en SQL Audiovisual
Convención de nombres: restricciones PDF
Buenas prácticas: codificación de transacciones PDF
Convención de nombres: componentes PDF
Complementos de SQL para procedimientos almacenados PDF
Convención de nombres: convenciones en SQL PDF
Buenas prácticas: codificación de procedimientos y funciones PDF
Almacenes de columnas: contextualización PDF
Buenas prácticas: codificación de consultas PDF
Almacenes de columnas: procesamiento de consultas PDF
Almacenes de columnas: características PDF
Contextualización de disparadores PDF
Buenas prácticas: codificación SQL PDF
Contextualización de procedimientos PDF
Almacenes de columnas: compresión de datos PDF
Almacenes de columnas: Procesamiento de consultas (Parte I) Audiovisual
Almacenes de columnas: Procesamiento de consultas (Parte II) Audiovisual
Almacenes de columnas: Procesamiento de consultas (Parte III) Audiovisual
Almacenes de columnas: Procesamiento de consultas (Parte IV) Audiovisual
Almacenes de columnas: Compresión de datos (Parte VIII) Audiovisual
Almacenes de columnas: Compresión de datos (Parte VII) Audiovisual
Almacenes de columnas: Compresión de datos (Parte VI) Audiovisual
Almacenes de columnas: Compresión de datos (Parte V) Audiovisual
Almacenes de columnas: Compresión de datos (Parte IV) Audiovisual
Almacenes de columnas: Compresión de datos (Parte III) Audiovisual
Almacenes de columnas: Compresión de datos (Parte II) Audiovisual
Almacenes de columnas: Compresión de datos (Parte I) Audiovisual
Almacenes de columnas: Características III Audiovisual
Almacenes de columnas: Características II Audiovisual
Almacenes de columnas: Características I Audiovisual
Almacenes de columnas: Contextualización Audiovisual
Contextualización de procedimientos Audiovisual
Buenas prácticas: Codificación de procedimientos y funciones Audiovisual
Buenas prácticas: Codificación de consultas Audiovisual
Buenas prácticas: Codificación SQL Audiovisual
Convención de nombres: Restricciones Audiovisual
Buenas prácticas: codificación de transacciones Audiovisual
Contextualización de disparadores Audiovisual

Amunt

El material principal de apoyo de la asignatura son los módulos didácticos previamente descritos.

Para lograr las competencias relativas al aprendizaje del lenguaje SQL usaremos el sistema gestor de bases de datos PostgreSQL. Para poder instalarlo, debéis de realizar la descarga desde: http://www.postgresql.org/download/. Si tenéis instalado en vuestro equipo versiones superiores podéis trabajar con ellas.

Finalmente, también se proporcionará material complementario, a través de los diferentes espacios del aula. Entre este material se destacan las guías de instalación de software y colecciones de ejercicios.

Amunt

Cómo ya se ha comentado el material de referencia de la asignatura son los módulos didácticos que tenéis disponibles dentro del aula. Allí podéis consultar la bibliografía básica de la asignatura. Adicionalmente, en cada módulo didáctico podéis encontrar bibliografía más específica relacionada con los contenidos de cada uno de estos módulos didácticos.

Amunt

El estudio de la asignatura gira fundamentalmente entorno a los siguientes conceptos:

  • Estudio del material de la asignatura (módulos didácticos, vídeos y apuntes).
  • Otros materiales complementarios que se pueden suministrar a través de los diferentes espacios del aula.
  • Realización de ejercicios de autoevaluación. Se incluyen tanto los ejercicios propuestos en los diferentes módulos didácticos, como otros que se puedan suministrar a través de los diferentes espacios del aula.
  • Pruebas de evaluación continuada (PEC)

Además, se recomienda consultar el apartado de Planificación del aula para asegurarse de llevar el ritmo adecuado de aprendizaje, y que queda explicitado a través de diferentes fechas clave. El conjunto de fechas clave también se encuentra disponible al final de este Plan Docente.

El seguimiento activo de los espacios de Comunicación del aula es de primordial interés, allí se plantearán dudas, se darán respuestas y se tratarán temas y aspectos relacionados con la materia de estudio.

En relación a los ejercicios de autoevaluación, es importante destacar que tienen que servir para que el estudiante evalúe su nivel de comprensión, no para ver más ejemplos. Por eso se recomienda para cada ejercicio de autoevaluación:1) leerlo con detenimiento y resolverlo de manera individual. 2) Comparar la solución con que aparece en el solucionario (puede pasar perfectamente que sean diferentes). 3) En caso de dudas respecto a la corrección de vuestra solución, plantearlas en los espacios de comunicación del aula (en concreto, en el Foro).

Finalmente, todos los estudiantes de esta asignatura tenéis acceso a un aula de Laboratorio. El objetivo de esta aula, dirigida por un consultor diferente del aula de la asignatura, es asistiros en la instalación y problemas técnicos derivados de la instalación del software de las asignaturas que estéis cursando. En el caso de la asignatura objeto de este plan docente, nos referimos a la instalación de PostgreSQL. Entendedlo, pues, como un espacio de apoyo al trabajo con el software de la asignatura. En ningún caso tenéis que dirigir cuestiones de teoría a esta aula, ni usarla como foro de discusión para la resolución de problemas relacionados con los ejercicios planteados en las PEC.

Amunt

La Normativa académica de la UOC dispone que el proceso de evaluación se fundamenta en el trabajo personal del estudiante y presupone la autenticidad de la autoría y la originalidad de los ejercicios realizados.

La falta de originalidad en la autoría o el mal uso de las condiciones en las que se hace la evaluación de la asignatura es una infracción que puede tener consecuencias académicas graves.

El estudiante será calificado con un suspenso (D/0) si se detecta falta de originalidad en la autoría de alguna actividad evaluable (práctica, prueba de evaluación continua (PEC) o final (PEF), o la que se defina en el plan docente), ya sea porque ha utilizado material o dispositivos no autorizados, ya sea porque ha copiado de forma textual de internet, o ha copiado de apuntes, de materiales, manuales o artículos (sin la citación correspondiente) o de otro estudiante, o por cualquier otra conducta irregular.

La calificación de suspenso (D/0) en la evaluación continua (EC) puede conllevar la obligación de hacer el examen presencial para superar la asignatura (si hay examen y si superarlo es suficiente para superar la asignatura según indique este plan docente).

Cuando esta mala conducta se produzca durante la realización de las pruebas de evaluación finales presenciales, el estudiante puede ser expulsado del aula, y el examinador hará constar todos los elementos y la información relativos al caso.

Además, esta conducta puede dar lugar a la incoación de un procedimiento disciplinario y la aplicación, si procede, de la sanción que corresponda.

La UOC habilitará los mecanismos que considere oportunos para velar por la calidad de sus titulaciones y garantizar la excelencia y la calidad de su modelo educativo.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.


Ponderación de las calificaciones

Opción para superar la asignatura: EC

Nota final de asignatura: EC

Amunt

La evaluación continua, en el contexto de la asignatura, incluye 4 Pruebas de Evaluación Continuada (PEC) de realización individual. Es obligatorio realizar un mínimo 3 PEC para poder aprobar la asignatura.

A continuación se detallan los módulos didácticos que se evalúan en cada PEC, y su peso en el cálculo de nota final de PEC:

  • PEC 1: bloque didáctico 1. Peso 25%.
  • PEC 2: bloque didáctico 2. Peso 25%.
  • PEC 3: bloque didáctico 3. Peso 25%.
  • PEC 4: bloques didácticos 4 y 5. Peso 25%.

Las PEC se deben entregar dentro de los plazos establecidos en este plan docente (véase el apartado de fechas clave). En caso de situaciones excepcionales que no permitan cumplir los plazos, por favor poneros en contacto con vuestro profesor colaborador antes de la finalización de la PEC para evaluar alternativas.

El seguimiento correcto de la asignatura os compromete a realizar las PEC propuestas según las indicaciones que se indican en su enunciado y este Plan Docente. En caso de que no sea así, las actividades se evaluarán con una calificación de suspenso (D). Por otro lado, y a criterio de la Universidad, el incumplimiento de esta obligación será comunicada a la gestión de los estudios, con el fin de evaluar si el estudiante está autorizado para aprobar cualquier otra materia mediante una evaluación continua en el semestre en curso o el siguiente.

Amunt

Esta asignatura únicamente se puede superar a través de la realización y entrega de un mínimo de 3 de las PEC propuestas a lo largo del semestre. La nota final de EC será la media ponderada de las 4 PEC. Es importante destacar:

  • Aquellos estudiantes que únicamente hayan entregado 1 PEC tendrán como nota final de EC N (no presentado).
  • Aquellos estudiantes que hayan entregado sólo 2 PEC tendrán una calificación final de EC de suspenso.
  • Las PEC entregadas que no incluyan al menos un 25% de los ejercicios propuestos resueltos serán consideradas como no presentadas.
  • Las PEC no presentadas computan como 0 en el cálculo de la nota final de EC.

Amunt

En el contexto de la asignatura, el equipo docente podrá hacer tres tipos de retorno acerca de las actividades evaluables realizadas por los estudiantes:

Retorno general: consiste en la publicación de una posible solución oficial (con explicaciones, en caso de que éstas sean necesarias) de las actividades evaluables propuestas (PEC). Este tipo de retorno siempre se realizará. La publicación de las soluciones oficiales se realizará tras la fecha límite de entrega fijada para los estudiantes (en general, un par de días después).

Retorno a nivel de grupo: consiste en la publicación (vía tablón o conjuntamente con la solución oficial de las actividades evaluables) de los errores más frecuentemente realizados por los estudiantes. Este tipo de retorno sólo se realizará en caso de ser pertinente, y una vez que el equipo docente haya finalizado el proceso de corrección.

Retorno individualizado: consiste en la realización de comentarios individuales sobre las entregas realizadas por los estudiantes de las actividades evaluables. Se realizará siempre en el caso de aquellos estudiantes para los cuales, en función de su evolución, incurran en riesgo de no superar la asignatura. Se puede realizar mediante el buzón personal o el registro de evaluación continua, una vez el equipo docente haya finalizado el proceso de corrección. En relación al retorno individualizado, es importante destacar que cualquier estudiante lo puede solicitar, tanto a nivel de evolución del semestre como tras cada PEC. Se recomienda hacer esta petición después de cada PEC sobre la que tengáis dudas o necesidades de aclaración, y no esperar a las calificaciones finales. En el proceso de revisión puede participar el equipo docente al completo (consultor y profesor responsable de la asignatura).

Amunt