Bases de datos analíticas Código:  M2.888    :  6
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en el que se proyecta   Conocimientos previos   Información previa a la matrícula   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de la UOC para la asignatura   Información adicional sobre los recursos de aprendizaje y herramientas de apoyo   Informaciones sobre la evaluación en la UOC   Consulta del modelo de evaluación  
Este es el plan docente de la asignatura para el segundo semestre del curso 2023-2024. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

El concepto de bases de datos analíticas surgió en la década de 1970 con el desarrollo de los sistemas de procesamiento de transacciones en línea que se utilizaban para el registro y seguimiento de transacciones comerciales. A medida que las organizaciones comenzaron a acumular grandes cantidades de datos, surgió la necesidad de analizar los datos de manera más profunda con el objetivo de convertirlos en información. Con el crecimiento exponencial de datos y la demanda de análisis más sofisticados en los años 80, y con el auge de Internet y el comercio electrónico durante los años 90, se desencadenó una mayor demanda de tecnologías que pudieran gestionar y analizar grandes volúmenes de datos de manera efectiva. En este contexto, surgieron nuevas tecnologías de bases de datos analíticas, como los almacenes de datos, ofreciendo un mejor rendimiento al realizar consultas analíticas complejas.

En las últimas décadas y con la explosión de datos generados por redes sociales, dispositivos móviles y sensores IoT, las bases de datos analíticas han seguido evolucionando para facilitar la gestión y el análisis de nuevos tipos de datos. Adicionalmente, han surgido tecnologías para el procesamiento distribuido y el cómputo en la nube, que han permitido escalar los sistemas de bases de datos analíticas para gestionar grandes volúmenes de datos de una forma eficaz.

El objetivo de esta asignatura es aprender los conocimientos y habilidades necesarias para trabajar con datos de manera efectiva en un entorno empresarial o académico, permitiendo el análisis de datos complejos con el objetivo de llevar a cabo la toma de decisiones basada en los datos.

Para ello se deberá conocer los fundamentos teóricos de las bases de datos analíticas, incluyendo las diferentes arquitecturas y los modelos de datos, así como los conceptos del proceso de diseño de las bases de datos destinadas al análisis. Se adquirirán los conocimientos necesarios para comprender los procesos de integración, como punto clave para extraer datos de diversas fuentes, transformarlos en un formato adecuado y cargarlos en una base de datos analítica, así como los conocimientos para utilizar las bases de datos para analizar conjuntos de datos, y extraer información significativa para presentar la información de manera clara y comprensible.


Amunt

Bases de datos analíticas es una asignatura obligatoria en el Máster Universitario en Ciencia de datos que forma parte del conjunto de asignaturas que son complementos de formación. Por tanto, una asignatura de entrada que da fundamentos para cursar otras materias relacionadas con los de datos.


Amunt

 

Los conocimientos adquiridos en esta asignatura serán de utilidad para perfiles tales como arquitectos, ingenieros y científicos de datos, analistas de datos, o administradores de bases de datos. Es decir, profesionales responsables de realizar  análisis de datos mediante las diferentes herramientas que proporcionan las plataformas analíticas.


 

Amunt

No es necesario disponer de conocimientos previos, pero sí que se requiere de cierto conocimiento de la lengua inglesa para comprender documentación técnica de los productos instalados y/o información de referencia disponible en la red.


Amunt

 La información que los estudiantes deben conocer antes de matricularse es:

 

  • Es una asignatura práctica.
  • Su modelo de evaluación es EC y la PR es la actividad de evaluación fundamental del curso. Es obligatoria y requiere una calificación mínima para aprobar.
  • Se dispone de un entorno de prácticas configurado para la realización de la práctica y soporte a dicho entorno.
  • Ver conocimientos previos en el apartado anterior.

 


 

Amunt

El objetivo de esta asignatura es dar al estudiante una visión general en materia de bases de datos y más concretamente, contextualizar al estudiante en el diseño de las bases de datos relacionales y el uso del lenguaje estructurado de consultas SQL, para posteriormente introducir el análisis de datos mediante el modelo multidimensional y tabular. 

Las principales competencias que el estudiante debe adquirir en el contexto de la asignatura son las que se indican a continuación:

  • Dado un problema de ciencia de datos, saber identificar los datos implicados, estar familiarizado con el ciclo de vida del dato y con todos los sistemas implicados. 
  • Adquirir los conocimientos necesarios para acceder y actualizar los datos almacenados en las bases de datos mediante el lenguaje SQL.
  • Ser capaz de poblar los almacenes de datos a partir de distintas fuentes de información mediante la creación y ejecución de procesos ETL.
  • Conocer y adquirir destreza en la utilización de diferentes tipos de aplicaciones y herramientas (EIS, OLAP, sistemas in-memory) para una óptima explotación del almacén de datos.
  • Ser capaz de llegar a conclusiones importantes como consecuencia del análisis de resultados obtenidos de la explotación de datos.

 

Amunt

Los contenidos principales de la parte teórica de la asignatura se recogen en los módulos didácticos que se detallan a continuación:

  • Datos, información y conocimiento. Se aborda de manera exhaustiva el concepto de dato, tanto en su definición general como en su relevancia para el análisis de información, para después desglosar las etapas del ciclo de vida de un dato, desde su generación, análisis, archivado y eventual eliminación.  Introduce el concepto de Almacén de Datos o Data Warehouse, que se examinará con más detalle a lo largo del curso, para concluir con una introducción al proceso de análisis de datos, presentando las fases que lo componen, así como una breve descripción de las herramientas analíticas más comúnmente empleadas en este campo.
  • Sistemas de bases de datos relacionales. Se ofrece una visión global de los sistemas de bases de datos relacionales: cuales son sus objetivos y características principales, qué características tiene el modelo relacional, cuales son las distintas etapas del proceso de diseño de una base de datos, así como una introducción al lenguaje estándar de acceso y tratamiento de datos.
  • Sistemas de bases de datos analíticas. Se ofrece una visión global de los  sistemas de bases de datos analíticas, introduciendo el concepto de FIC o Factoría de Información Corporativa, así como de los componentes que la constituyen. De todos sus componentes se focaliza en el data warehouse y los data marts como elementos base en el almacén de los datos de una corporación, y los metadatos y procesos de integración y transformación responsables del flujo de los datos. Posteriormente se introduce el mundo del análisis de los datos, detallando los sistemas multidimensionales/OLAP y los sistemas  tabulares, como dos arquitecturas destinadas a facilitar el acceso a los usuarios a los datos y llevar a cabo análisis desde diferentes perspectivas. Por último, en un nivel más técnico, se introduce el uso de las consultas avanzadas a tener en cuenta en los análisis complejos de datos.
  • Análisis de datos. Se introduce el concepto de presentación e interpretación de datos como punto de partida para conocer los distintos métodos y herramientas disponibles para llevar a cabo el análisis de datos. Se detallan las tres grandes formas de analizar los datos: el autoconsumo mediante el uso del lenguaje SQL, el uso de modelos multidimensionales y herramientas OLAP y, por último,  utilizando herramientas de representación visual.

El módulo Sistemas de bases de datos relacionales no es un módulo como los demás, es una guía de estudio que indica como estudiar el módulo a partir de un conjunto variado de recursos. 

Amunt

Ejemplos de código SQL Web
Buenas prácticas: codificación de procedimientos y funciones PDF
Buenas prácticas: codificación SQL PDF
Buenas prácticas: Codificación de procedimientos y funciones Audiovisual
Diseño físico de bases de datos PDF
El lenguaje SQL I PDF
Datos, información y conocimiento PDF
Sistemas de bases de datos relacionales PDF
Sistemas de bases de datos analíticas PDF
Análisis de datos PDF
Material del curso Bases de datos analíticas (Cuestionarios Moodle)
Material de soporte de Bases de datos analíticas (Juego de actividades prácticas)

Amunt

En el aula de teoría se encuentran TODOS los recursos de la asignatura, incluido el software y herramientas para llevar a cabo las actividades prácticas de curso.

En lo que respecta a teoría, cada módulo didáctico tiene asociada una guía de estudio. Esto es debido a que los módulos son bastante completos para poder ser autocontenidos y algunos apartados pueden considerarse opcionales para profundizar, si se desea. Las guías ayudan a abordar el estudio de cada módulo de forma más dirigida y eficiente. 

Además, se dispone de otros recursos adicionales. Entre ellos destacan un conjunto de actividades de muestra, que en ningún caso deben entenderse como un manual o guía paso a paso para realizar las actividades de curso. Simplemente son un ejemplo.

Cada actividad evaluable del curso dispone de un conjunto de recursos asociados que se encuentran en la sección Recursos de aprendizaje de cada actividad. Estos recursos pueden ser de variada tipología como módulos de otras asignaturas, presentaciones que resumen contenidos, ejemplos de código, vídeos de soporte, etc.

En lo que se refiere a recursos para la parte práctica de la asignatura, se proporciona un entorno de prácticas basado en escritorios virtuales (entorno VDI), previamente configurados para la realización de las actividades prácticas del curso, de modo que se asegure que todos los estudiantes disponen de las mismas versiones de las herramientas. Este entorno virtual es de uso únicamente docente.

En la parte servidor:

  • Sistema operativo: Windows Server 2016
  • Base de datos: Windows SQL Server 2016 (SGBD + SQL Server Analysis Services + SQL Server Reporting Services) y PostgreSQL version 16

 

Y en la parte cliente:

  • SQL Server Management Studio 2017
  • Visual Studio 2017
  • SQL Server Data Tools
  • Power BI Desktop
  • Pentaho Data Integration v.9.2

 

En concreto hay que destacar, por su importancia, los siguientes dos documentos:

  • DW_Entorno_Virtual_VDI.pdf: como guía de configuración y conexión.

  • Importar_base_de_datos_como_crear_Vistas_y_Cubos.pdf: con indicaciones sobre cómo proceder en la creación de cubos.

Y para ofrecer soporte técnico en este entorno y resolver las incidencias que puedan suceder con el uso del entorno VDI o del software instalado, se dispondrá de un profesor/a en el aula de laboratorio, 06.596.- Laboratorio de soporte a las bases de datos analíticas. Dado que esta aula será diferente del aula de teoría, se deberá consultar frecuentemente las dos aulas.


Amunt

En la UOC, la evaluación generalmente es virtual. Se estructura en torno a la evaluación continua, que incluye diferentes actividades o retos; la evaluación final, que se lleva a cabo mediante pruebas o exámenes, y el trabajo final de la titulación.

Las actividades o pruebas de evaluación pueden ser escritas y/o audiovisuales, con preguntas aleatorias, pruebas orales síncronas o asíncronas, etc., de acuerdo con lo que decida cada equipo docente. Los trabajos finales representan el cierre de un proceso formativo que implica la realización de un trabajo original y tutorizado que tiene como objetivo demostrar la adquisición competencial hecha a lo largo del programa.

Para verificar la identidad del estudiante y la autoría de las pruebas de evaluación, la UOC se reserva la potestad de aplicar diferentes sistemas de reconocimiento de la identidad y de detección del plagio. Con este objetivo, la UOC puede llevar a cabo grabación audiovisual o usar métodos o técnicas de supervisión durante la ejecución de cualquier actividad académica.

Asimismo, la UOC puede exigir al estudiante el uso de dispositivos electrónicos (micrófonos, cámaras u otras herramientas) o software específico durante la evaluación. Es responsabilidad del estudiante asegurar que estos dispositivos funcionan correctamente.

El proceso de evaluación se fundamenta en el trabajo personal del estudiante y presupone la autenticidad de la autoría y la originalidad de las actividades académicas. La web sobre integridad académica y plagio de la UOC contiene información al respecto.

La falta de autenticidad en la autoría o de originalidad de las pruebas de evaluación; la copia o el plagio; la suplantación de identidad; la aceptación o la obtención de cualquier actividad académica a cambio o no de una contraprestación; la colaboración, el encubrimiento o el favorecimiento de la copia, o el uso de material, software o dispositivos no autorizados en el plan docente o el enunciado de la actividad académica, incluida la inteligencia artificial y la traducción automática, entre otras, son conductas irregulares en la evaluación que pueden tener consecuencias académicas y disciplinarias graves.

Estas conductas irregulares pueden conllevar el suspenso (D/0) en las actividades evaluables definidas en el plan docente -incluidas las pruebas finales- o en la calificación final de la asignatura, ya sea porque se han utilizado materiales, software o dispositivos no autorizados durante las pruebas (como el uso de inteligencia artificial no permitida, redes sociales o buscadores de información en internet), porque se han copiado fragmentos de texto de una fuente externa (internet, apuntes, libros, artículos, trabajos o pruebas de otros estudiantes, etc.) sin la citación correspondiente, por la compraventa de actividades académicas, o porque se ha llevado a cabo cualquier otra conducta irregular.

Asimismo, y de acuerdo con la normativa académica, las conductas irregulares en la evaluación también pueden dar lugar a la incoación de un procedimiento disciplinario y a la aplicación, si procede, de la sanción que corresponda, de conformidad con lo establecido en la normativa de convivencia de la UOC.

En el marco del proceso de evaluación, la UOC se reserva la potestad de:

  • Solicitar al estudiante que acredite su identidad según lo establecido en la normativa académica.
  • Solicitar al estudiante que acredite la autoría de su trabajo a lo largo de todo el proceso de evaluación, tanto en la evaluación continua como en la evaluación final, a través de una entrevista oral síncrona, que puede ser objeto de grabación audiovisual, o por los medios establecidos por la UOC. Estos medios tienen el objetivo de verificar los conocimientos y las competencias que garanticen la identidad del estudiante. Si no es posible garantizar que el estudiante es el autor de la prueba, esta puede ser calificada con una D, en el caso de la evaluación continua, o con un suspenso, en el caso de la evaluación final.

Inteligencia artificial en el marco de la evaluación

La UOC reconoce el valor y el potencial de la inteligencia artificial (IA) en el ámbito educativo y, a su vez, pone de manifiesto los riesgos que supone si no se utiliza de forma ética, crítica y responsable. En este sentido, en cada actividad de evaluación se informará al estudiantado sobre las herramientas y los recursos de IA que se pueden utilizar y en qué condiciones. Por su parte, el estudiantado se compromete a seguir las indicaciones de la UOC a la hora de realizar las actividades de evaluación y de citar las herramientas utilizadas y, concretamente, a identificar los textos o imágenes generados por sistemas de IA, los cuales no podrá presentar como si fueran propios.

Respecto a usar o no la IA para resolver una actividad, el enunciado de las actividades de evaluación indica las limitaciones en el uso de estas herramientas. Debe tenerse en cuenta que usarlas de manera inadecuada, como por ejemplo en actividades en las que no están permitidas o no citarlas en las actividades en las que sí lo están, puede considerarse una conducta irregular en la evaluación. En caso de duda, se recomienda que, antes entregar la actividad, se haga llegar una consulta al profesorado colaborador del aula.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.

 

Amunt