Bases de Datos para Data Warehouse Código:  B2.336    :  4
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en el que se proyecta   Conocimientos previos   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de los que dispone la asignatura   Recursos de aprendizaje y herramientas de apoyo   Informaciones sobre la evaluación en la UOC   Consulta del modelo de evaluación  
ATENCIÓN: Este es el plan docente de la asignatura para el primer semestre del curso 2020-2021. Os servirá para planificar la matrícula. Una vez empiece la docencia, tenéis que consultarlo en el aula. (El plan docente puede estar sujeto a cambios).

Las bases de datos son el mecanismo más habitual que las organizaciones utilizan para almacenar y procesar de manera no volátil los datos necesarios para su actividad diaria. A su vez, las bases de datos son gestionadas y manipuladas mediante un software altamente especializado y complejo denominado sistema gestor de bases de datos. Desde un punto de vista de uso, las bases de datos nos permiten gestionar el día a día de las organizaciones y por ello también se las conoce bajo la denominación de bases de datos operacionales. Por otro lado, tenemos los almacenes de datos (data warehouse) que integran datos de diferentes fuentes, entre las que se encuentran las bases de datos operacionales, y que tienen como objetivo principal dar apoyo a la toma de decisiones.

Para poder guardar los datos de interés de una organización, hay que disponer de algún modelo de datos que permita su representación en un ordenador en forma de bases de datos. Este modelo de datos tiene que permitir, por un lado, definir la estructura de la base de datos y las reglas de integridad que garantizan que la base de datos sea consistente. Por otro lado, el modelo de datos también tiene que proporcionar operaciones que permitan la consulta y actualización de la base de datos. A pesar de que existen diferentes modelos de datos, nosotros nos centraremos en el modelo de datos relacional, dado que es el más utilizado.

Esta  asignatura tiene por objetivo adquirir conceptos, procedimientos y buenas prácticas para la creación y manipulación de las bases de datos que dan soporte a la construcción de almacenes de datos. Para ello se profundiza en el aprendizaje del lenguaje SQL, extendiéndolo mediante el estudio del lenguaje procedimental PL/pgSQL, y en el diseño físico de bases de datos, así como en bases de datos orientadas a columnas. Estas bases de datos también se basan en el modelo relacional y se caracterizan por el almacenamiento de los datos en forma de columnas. Esta característica las hace especialmente idóneas para entornos OLAP.

Amunt

Esta asignatura, en el contexto de los diferentes programas formativos de Business Intelligence, forma parte de la especialidad de Sistemas de información de inteligencia de negocio (data warehouse). En esta especialidad se adquieren las competencias para diseñar, construir, mantener y explotar los sistemas de información de inteligencia de negocio más habituales, es decir, los que se basan en el uso de bases de datos relacionales para la construcción de un almacén de datos o data warehouse. Esta especialidad incluye, además de la asignatura objeto de este plan docente, las siguientes asignaturas:

  • Diseño y construcción del almacén de datos, donde se aprende a crear un almacén de datos adecuado que ofrezca soporte en la toma de decisiones de la organización. Se presenta a nivel conceptual la arquitectura de almacenamiento de un sistema de Business Intelligence para data warehousing y se dan pautas para la construcción de este tipo de sistemas.
  • Explotación y administración de sistemas de data warehouse, donde se aprende a evaluar la viabilidad de la construcción de un almacén de datos y a explotar y administrar sistemas de data warehouse. Con este fin se presentan las distintas formas de presentar los datos y qué tipos de  herramientas pueden ofrecer el tipo de visualización que interesa. Asimismo se enseña a administrar el  sistema durante su desarrollo, implantación y/o posterior explotación de los datos.

Amunt

El objetivo de la especialidad de Sistemas de información de inteligencia de negocio (data warehouse) es formar aquellos perfiles tecnológicos (diseñadores, analistas, programadores, configuradores y responsables de los servicios técnicos) que componen las soluciones de Inteligencia de negocio: bases de datos, almacenamiento, extracción, tratamiento y carga de datos, construcción de aplicaciones de usuario, etc.

En concreto, en el caso de esta asignatura, los campos profesionales en los que se proyecta son "Programador SQL", "Programador de Sistemas de BI", "Consultor de Proyectos BI" y "Desarrollador ETL".

Amunt

Esta especialidad se dirige a perfiles técnicos e ingenieros informáticos o de telecomunicación, analistas de datos en departamentos de control de gestión u otros, matemáticos o candidatos con una experiencia profesional equivalente.

Son deseables conocimientos básicos en bases de datos relacionales, en concreto, en los principios teóricos sobre los que se sustentan este tipo de bases de datos, y las características del software especializado que las gestiona (el sistema gestor de bases de datos). En el caso de tener dificultades con los contenidos de los bloques didácticos, el equipo docente podrá proporcionar materiales adicionales para nivelar los conocimientos del estudiante.

Amunt

Las principales competencias que el estudiante tiene que adquirir en el contexto de la asignatura son las que se indican a continuación:

  • Ser capaz de consultar y actualizar de manera eficiente una base de datos mediante SQL estándar.
  • Ser capaz de codificar procedimientos almacenados utilizando lenguajes procedimentales.
  • Ser capaz de implementar diferentes técnicas de disparadores en una base de datos.
  • Ser capaz de entender y aplicar conceptos avanzados de SQL como funciones analíticas, transacciones o Common Table Expression.
  • Ser capaz de realizar el diseño físico de bases de datos relacionales.
  • Conocer las características de las bases de datos orientadas a columnas, y saberlas situar en el contexto del área de bases de datos.
  • Entender las principales técnicas que implementa un sistema gestor de bases de datos orientado a columnas.
  • Ser capaz de aplicar los conocimientos anteriores dentro del contexto del data warehouse/OLAP.

Amunt

La asignatura consta de 5 bloques didácticos, cuyo contenido se detalla a continuación:

Bloque 1. El lenguaje SQL: introducción

En este bloque didáctico se presentan los conceptos más básicos asociados al SQL estándar. En primer lugar se presentan las principales sentencias de definición de datos (cómo seria, por ejemplo, tablas y vistas). A continuación se presentan las sentencias básicas de manipulación de datos (SELECTINSERTDELETE y UPDATE de tablas y vistas). Finalmente, se introducen las sentencias de concesión y revocación de privilegios sobre los datos, primitivas de gestión de transacciones, y otras modalidades de trabajo con el lenguaje SQL.

Los materiales principales que se utilizarán en este bloque didáctico serán: el módulo didáctico "El lenguaje SQL I", y dos series de vídeos muy importantes: convenciones de nombres y buenas prácticas en SQL, focalizándose esta última serie en las buenas prácticas de codificación en SQL y generación de consultas. Estos materiales se complementan con las transcripciones de cada uno de los vídeos de las series y un documento con la convención de nombres a seguir durante la asignatura.

Bloque 2. El lenguaje SQL: procedimientos y disparadores

En este bloque didáctico se presentan los conceptos más avanzados asociados al SQL estándar. En primer lugar, se presenta la estructura básica de componentes de un entorno SQL, revisando los conceptos de servidores, catálogos y esquemas, para continuar una introducción a los conceptos de conexión, sesión y transacción. A continuación, se completará el estudio de los componentes lógicos vistos mediante la introducción de procedimientos almacenados y disparadores. Finalmente, se introducen el lenguaje procedimental PL/pgSQL y las sentencias que ofrece PostgreSQL para definir estos componentes.

Los materiales principales que se utilizarán en este bloque didáctico serán: el módulo didáctico "El lenguaje SQL II", la serie de vídeos de buenas prácticas en SQL, focalizándose ésta en las buenas prácticas de codificación de procedimientos almacenados, y dos vídeos que contextualizarán los procedimientos y disparadores en el marco de las bases de datos operacionales y del data warehouse. Estos materiales se complementan con las transcripciones de cada uno de los vídeos de las series y con un documento de complementos de SQL para la codificación de procedimientos almacenados.

Bloque 3. Complementos de SQL

En este bloque didáctico se presentan conceptos avanzados de SQL de aplicación en entornos Data Warehouse. En primer lugar, se presenta el concepto de clave subrogada y las diferentes posibilidades de implementar esta técnica mediante SQL. A continuación, se introducirán dos conceptos avanzados para la creación de consultas SQL, las Common Table Expression y las funciones analíticas, cómo aplicar estas funcionalidades y los beneficios asociados. Por último, se verán técnicas de tratamiento de valores nulos en bases de datos operacionales y Data Warehouse, y se concluirá con una introducción a las transacciones, sus propiedades, la problemática asociada a éstas, mecanismos de implementación de transacciones en PostgreSQL y la importancia de éstas en entornos de bases de datos operacionales y Data Warehouse.

Los materiales principales que se utilizarán en este bloque didáctico serán: el módulo didáctico "Complementos de SQL" y la serie de vídeos de buenas prácticas en SQL, focalizándose en las buenas prácticas de codificación de transacciones. Estos materiales se complementan con las transcripciones de cada uno de los vídeos de la serie.

Bloque 4. Introducción al diseño físico de bases de datos

Este bloque didáctico analizará los principales métodos y construcciones que se utilizan en el diseño físico de bases de datos. Conceptualmente, podemos definir el diseño físico de una base de datos como el proceso que, a partir del diseño lógico de la base de datos y de información sobre su uso esperado, creará una configuración física de la base de datos adaptada al entorno donde se alojará y que permita el almacenamiento y la explotación de los datos con un rendimiento adecuado.

Los materiales principales que se utilizarán en este bloque didáctico será el módulo didáctico "Introducción al diseño físico de bases de datos".

Bloque 5. Bases de datos orientadas a columnas

Este bloque didáctico presentará las principales características y utilidad de las bases de datos orientadas a columnas (más habitualmente conocidas como column stores), así como las diferencias que presentan con las bases de datos relacionales más tradicionales (denominadas row stores). Asimismo se explicarán las principales técnicas que permiten implementar dichas características. Finalmente se proporcionará una visión de los principales productos disponibles en el mercado.

Los materiales que se utilizarán serán vídeos y sus apuntes correspondientes.

Amunt

Buenas prácticas: Codificación SQL Audiovisual
Almacenes de columnas: Compresión de datos (Parte III) Audiovisual
Buenas prácticas: Codificación de procedimientos y funciones Audiovisual
Almacenes de columnas: Características I Audiovisual
Buenas prácticas: codificación de transacciones PDF
Almacenes de columnas: Compresión de datos (Parte VI) Audiovisual
Buenas prácticas: codificación de procedimientos y funciones PDF
Almacenes de columnas: Procesamiento de consultas (Parte IV) Audiovisual
Almacenes de columnas: Compresión de datos (Parte VIII) Audiovisual
Convención de nombres: convenciones en SQL PDF
Buenas prácticas: Codificación de consultas Audiovisual
Convención de nombres: Convenciones en SQL Audiovisual
Almacenes de columnas: Procesamiento de consultas (Parte II) Audiovisual
Buenas prácticas: codificación de transacciones Audiovisual
Contextualización de disparadores PDF
Almacenes de columnas: Características II Audiovisual
Almacenes de columnas: Compresión de datos (Parte V) Audiovisual
Buenas prácticas: codificación de consultas PDF
Convención de nombres: restricciones PDF
Almacenes de columnas: Compresión de datos (Parte VII) Audiovisual
Almacenes de columnas: procesamiento de consultas PDF
Complementos de SQL para procedimientos almacenados PDF
Contextualización de procedimientos Audiovisual
Convención de nombres: componentes PDF
Convención de nombres: Componentes Audiovisual
Buenas prácticas: codificación SQL PDF
Almacenes de columnas: Características III Audiovisual
Almacenes de columnas: Procesamiento de consultas (Parte III) Audiovisual
Almacenes de columnas: Compresión de datos (Parte IV) Audiovisual
Almacenes de columnas: Contextualización Audiovisual
Almacenes de columnas: Compresión de datos (Parte II) Audiovisual
Almacenes de columnas: Compresión de datos (Parte I) Audiovisual
Contextualización de disparadores Audiovisual
Almacenes de columnas: características PDF
Almacenes de columnas: compresión de datos PDF
Contextualización de procedimientos PDF
Almacenes de columnas: Procesamiento de consultas (Parte I) Audiovisual
Almacenes de columnas: contextualización PDF
Convención de nombres: Restricciones Audiovisual

Amunt

El material principal de apoyo de la asignatura son los módulos didácticos previamente descritos.

Para lograr las competencias relativas al aprendizaje del lenguaje SQL usaremos el sistema gestor de bases de datos PostgreSQL. Para poder instalarlo, debéis de realizar la descarga desde: http://www.postgresql.org/download/. Si tenéis instalado en vuestro equipo versiones superiores podéis trabajar con ellas.

Finalmente, también se proporcionará material complementario, a través de los diferentes espacios del aula. Entre este material se destacan las guías de instalación de software y colecciones de ejercicios.

Amunt

La Normativa académica de la UOC dispone que el proceso de evaluación se fundamenta en el trabajo personal del estudiante y presupone la autenticidad de la autoría y la originalidad de los ejercicios realizados.

La falta de originalidad en la autoría o el mal uso de las condiciones en las que se hace la evaluación de la asignatura es una infracción que puede tener consecuencias académicas graves.

Se calificará al estudiante con un suspenso (D/0) si se detecta falta de originalidad en la autoría de alguna actividad evaluable (práctica, prueba de evaluación continua (PEC) o final (PEF), o la que se defina en el plan docente), ya sea porque ha utilizado material o dispositivos no autorizados, ya sea porque ha copiado de forma textual de internet, o ha copiado de apuntes, de materiales, manuales o artículos (sin la citación correspondiente) o de otro estudiante, o por cualquier otra conducta irregular.

La calificación de suspenso (D/0) en la evaluación continua (EC) puede conllevar la obligación de hacer el examen presencial para superar la asignatura (si hay examen y si superarlo es suficiente para superar la asignatura según indique este plan docente).

Cuando esta mala conducta se produzca durante la realización de las pruebas de evaluación finales presenciales, el estudiante puede ser expulsado del aula, y el examinador hará constar todos los elementos y la información relativos al caso.

Además, esta conducta puede dar lugar a la incoación de un procedimiento disciplinario y la aplicación, si procede, de la sanción que corresponda.

La UOC habilitará los mecanismos que considere oportunos para velar por la calidad de sus titulaciones y garantizar la excelencia y la calidad de su modelo educativo.

Amunt

Esta asignatura sólo puede superarse a partir de la evaluación continua (EC). La nota final de evaluación continua se convierte en la nota final de la asignatura. La fórmula de acreditación de la asignatura es la siguiente: EC.

 

Amunt