Arquitecturas de bases de datos no tradicionales Código:  M2.852    :  6
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en el que se proyecta   Conocimientos previos   Información previa a la matrícula   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de la UOC para la asignatura   Información adicional sobre los recursos de aprendizaje y herramientas de apoyo   Informaciones sobre la evaluación en la UOC   Consulta del modelo de evaluación  
Este es el plan docente de la asignatura para el segundo semestre del curso 2023-2024. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

Esta asignatura constituye una introducción a las bases de datos NoSQL. En concreto, la asignatura proporciona al estudiante una visión de los múltiples conceptos, modelos y herramientas que se pueden agrupar bajo esta denominación.

Bajo el paraguas NoSQL se incluye todo un conjunto de bases de datos, basadas en diferentes modelos de datos, que constituyen una alternativa a las bases de datos relacionales, y que son especialmente idóneas para ciertos dominios de aplicación. Entre estos dominios destacan aquéllos que trabajan con grandes volúmenes de datos que se encuentran dispersos en diferentes repositorios, aquellos dominios que trabajan con datos poco estructurados y dominios en los que se establecen múltiples y complejas interrelaciones entre los datos.

Amunt

Esta asignatura forma parte del conjunto de asignaturas obligatorias del máster, y se recomienda que sea cursada durante el segundo semestre de estudios.

Amunt

El objetivo del máster de Data Science de la UOC es la formación de profesionales todo-terreno con una formación en análisis y solución de problemas de negocio, estadística avanzada y minería de datos y diseño y construcción de sistemas de información, que pueden trabajar en diferentes departamentos de la empresa o en un centro de competencias transversal. Los conocimientos y habilidades desarrollados en esta asignatura serán de especial utilidad en el almacenamiento y tratamiento de datos complejos (por su estructura, volumen, frecuéncia, tamaño, etc.) y en el diseño e implementación de sistemas que requieran distribución y/o replicación de datos.

Amunt

Son necesarios conocimientos de bases de datos relacionales y de SQL. Es recomendable disponer de conocimientos de data warehousing y sistemas distribuidos.

Además, se requiere capacidad para leer y comprender el idioma inglés puesto que una parte importante de los materiales de referencia, así como de otros recursos, están en dicho idioma.

Amunt

Algunos de los contenidos de esta asignatura deben estudiarse a partir de materiales y recursos escritos en inglés.

Amunt

  • Adquirir la destreza necesaria para la manipulación de datos, conversión de formatos y almacenamiento de los mismos.
  • Ser capaz de diseñar e implementar una infraestructura para almacenar un conjunto heterogéneo de datos, tanto en entornos centralizados como distribuidos en función del volumen y las necesidades de datos.
  • Saber utilizar el gestor de bases de datos más adecuada en cada contexto, incluyendo gestores tradicionales (relacionales básicamente) y no tradicionales (NoSQL básicamente).
  • Ser capaz de contextualizar los conceptos fundamentales de bases de datos NoSQL y ponerlos en valor.
  • Conocer los distintos modelos NoSQL: saber cómo organiza los datos cada uno de ellos y conocer sus principios básicos de diseño.
  • Saber definir modelos y hacer consultas en algunas bases de datos NoSQL concretas, señalando las características diferenciadoras de cada modelo.
  • Conocer las características principales y el funcionamiento de algunos de los productos NoSQL más relevantes.
  • Saber describir cómo las bases de datos NoSQL permiten escalar aplicaciones Big Data, haciendo referencia al teorema CAP, y entender el concepto de escalado horizontal (sharding).

Amunt

La asignatura consta de 5 bloques temáticos, que a su vez incluyen diferentes temas. El contenido asociado a cada bloque temático es el que se detalla a continuación:

Bloque 1: Preliminares

En este bloque se realizará una introducción a las características fundamentales asociadas a las bases de datos NoSQL, haciendo hincapié en su definición, motivación, características e inconvenientes, así como su contextualización en el área de las bases de datos.

Bloque 2. Modelos de datos

En este bloque se presentaran los modelos de datos más relevantes que subyacen en las bases de datos NoSQL, así como algunas consideraciones de diseño a tener en cuenta cuando trabajamos con ellos. Los modelos de datos que estudiaremos son los modelos de agregación (que incluyen, a su vez, los modelos clave-valor, documental y orientado a columnas) y los modelos orientados a grafos.

Bloque 3. Distribución de datos

Buena parte de las bases de datos NoSQL se utilizan en entornos altamente distribuidos que gestionan grandes volúmenes de datos. Por ello es necesario presentar los principales conceptos relacionados con bases de datos distribuidas. Entre estos conceptos, por una parte, se incluyen la definición de base de datos distribuida, así como aspectos relativos a su diseño. Por otra parte, se tratarán características como la consistencia y disponibilidad de los datos en entornos altamente distribuidos, y cómo éstas quedan expresadas en el teorema CAP. Para ello será necesario estudiar el modelo de transacciones ACID en el que se basan las bases de datos relacionales y el modelo BASE que subyace en algunas bases de datos NoSQL.

Bloque 4. Bases de datos NoSQL

En este bloque se examinará, para cada uno de los modelos de datos presentado en el bloque 2, un ejemplo de base de datos NoSQL, es decir, un producto comercial concreto. Los productos que se presentarán son Riak, MongoDB, Cassandra y Neo4J que constituyen ejemplos de bases de datos NoSQL clave-valor, documental y orientada a grafos, respectivamente. Asimismo se discutirán aspectos relativos a distribución de datos para alguno de los productos estudiados.

Bloque 5. Uso de bases de datos NoSQL

En el último bloque está dedicado a la consulta y actualización de datos almacenados en BD NoSQL. En concreto trabajaremos con Neo4J (una BD orientada a grafos), Cassandra (una BD orientada a grandes columnas) y MongoDB (una BD de documentos). Contaremos con el soporte de dos casos prácticos.

Amunt

BD Twiter Web
Distributed Databases PDF
Transaction Models and Concurrency Control PDF
Espacio de recursos de ciencia de datos Web
MV Bases de dades NoSQL Software en línea
Bases de datos NoSQL. Uso de máquina virtual PDF

Amunt

La asignatura incluye los tipos de material siguientes:

  • Vídeos y apuntes
  • Libros de texto (más información en el apartado de "Bibliografía y fuentes de información")
  • Materiales didácticos UOC, de dos tipos:
    • Material didáctico propio de la asignatura
    • Materiales didácticos de apoyo
  • Máquinas virtuales e indicaciones instalación de software

El material principal de la asignatura son un conjunto de vídeos. Estos vídeos se asocian a los temas de la asignatura que, a su vez, se encuadran en los cinco bloques temáticos descritos en el apartado "Contenidos" de este plan docente. Para cada vídeo, a su vez, se entrega (en formato pdf) su transcripción detallada. Estas transcripciones constituyen los apuntes de la asignatura.

Aparte de los vídeos, ciertos temas tienen asociada la lectura de ciertos capítulos de un libro de texto. Este libro de texto (reseñado en el apartado "Bibliografía y fuentes de información" de este plan docente) estará disponible en línea en el aula (en el apartado "Fuentes de información").

Finalmente, también os proporcionamos diversos materiales didácticos UOC en formato pdf. En primer lugar, éste es el caso del material asociado al último bloque temático de la asignatura (Bloque 5. Uso de bases de datos NoSQL) donde se presentan dos casos prácticos, uno sobre el diseño de una BD NoSQL en grafo y otro sobre el diseño de una BD NoSQL de documentos. Estos casos prácticos se orientan, respectivamente, a facilitar el aprendizaje de Neo4J y MongoDB.

En segundo lugar, el resto de materiales didácticos UOC que se suministran (de nuevo estos materiales se describen en el apartado "Bibliografía y fuentes de información" de este plan docente), son materiales de soporte que, o bien cubren conocimientos que se presuponen en el contexto de la asignatura, o bien amplían ciertos temas tratados en la asignatura (en concreto, en los vídeos y apuntes de la asignatura y el libro de texto). La lectura de estos materiales en más o menos profundidad dependerá de vuestros conocimientos previos o de vuestro interés en profundizar en la materia de estudio.

En tercer lugar, para el aprendizaje del bloque 5 (Uso de bases de datos NoSQL), tendréis acceso a una máquina virtual para MongoDB y recibiréis las instrucciones precisas para trabajar con Neo4J.

Para acabar, es posible que sea necesario la lectura de artículos de revista (que serán suministrados desde el aula) para ampliar o complementar los contenidos de la asignatura.

Amunt

El proceso de evaluación se fundamenta en el trabajo personal de cada estudiante y presupone la autenticidad de la autoría y la originalidad de los ejercicios realizados.

La falta de autenticidad en la autoría o de originalidad de las pruebas de evaluación; la copia o el plagio; el intento fraudulento de obtener un resultado académico mejor; la colaboración, el encubrimiento o el favorecimiento de la copia, o la utilización de material o dispositivos no autorizados durante la evaluación, entre otras, son conductas irregulares que pueden tener consecuencias académicas y disciplinarias graves.

Por un lado, si se detecta alguna de estas conductas irregulares, puede comportar el suspenso (D/0) en las actividades evaluables que se definan en el plan docente - incluidas las pruebas finales - o en la calificación final de la asignatura, ya sea porque se han utilizado materiales o dispositivos no autorizados durante las pruebas, como redes sociales o buscadores de información en internet, porque se han copiado fragmentos de texto de una fuente externa (internet, apuntes, libros, artículos, trabajos o pruebas del resto de estudiantes, etc.) sin la correspondiente citación, o porque se ha practicado cualquier otra conducta irregular.

Por el otro, y de acuerdo con las normativas académicas, las conductas irregulares en la evaluación, además de comportar el suspenso de la asignatura, pueden dar lugar a la incoación de un procedimiento disciplinario y a la aplicación, si procede, de la sanción que corresponda.

La UOC se reserva la potestad de solicitar al estudiante que se identifique o que acredite la autoría de su trabajo a lo largo de todo el proceso de evaluación por los medios que establezca la universidad (síncronos o asíncronos). A estos efectos, la UOC puede exigir al estudiante el uso de un micrófono, una cámara u otras herramientas durante la evaluación y que este se asegure de que funcionan correctamente.

La verificación de los conocimientos para garantizar la autoría de la prueba no implicará en ningún caso una segunda evaluación.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.

 

Amunt