Arquitecturas de bases de datos no tradicionales Código:  M2.852    :  6
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en el que se proyecta   Conocimientos previos   Información previa a la matrícula   Objetivos y competencias   Contenidos   Consulta de los materiales de los que dispone la asignatura   Materiales y herramientas de apoyo   Informaciones sobre la evaluación a la UOC   Consulta del modelo de evaluación  
ATENCIÓN: Esta información recoge los apartados del plan docente de la asignatura durante el último semestre con docencia. Al iniciar el periodo de matrícula, podrás consultar el calendario y modelo de evaluación para el siguiente semestre en Trámites / Matrícula / Horarios de las pruebas de evaluación final.

Esta asignatura constituye una introducción a las bases de datos NoSQL. En concreto, la asignatura proporciona al estudiante una visión de los múltiples conceptos, modelos y herramientas que se pueden agrupar bajo esta denominación.

Bajo el paraguas NoSQL se incluye todo un conjunto de bases de datos, basadas en diferentes modelos de datos, que constituyen una alternativa a las bases de datos relacionales, y que son especialmente idóneas para ciertos dominios de aplicación. Entre estos dominios destacan aquéllos que trabajan con grandes volúmenes de datos que se encuentran dispersos en diferentes repositorios, aquellos dominios que trabajan con datos poco estructurados y dominios en los que se establecen múltiples y complejas interrelaciones entre los datos.

Amunt

Esta asignatura forma parte del conjunto de asignaturas obligatorias del máster, y se recomienda que sea cursada durante el segundo semestre de estudios.

Amunt

El objetivo del máster de Data Science de la UOC es la formación de profesionales todo-terreno con una formación en análisis y solución de problemas de negocio, estadística avanzada y minería de datos y diseño y construcción de sistemas de información, que pueden trabajar en diferentes departamentos de la empresa o en un centro de competencias transversal. Los conocimientos y habilidades desarrollados en esta asignatura serán de especial utilidad en el almacenamiento y tratamiento de datos complejos (por su estructura, volumen, frecuéncia, tamaño, etc.) y en el diseño e implementación de sistemas que requieran distribución y/o replicación de datos.

Amunt

Son necesarios conocimientos de bases de datos relacionales y de SQL. Es recomendable disponer de conocimientos de data warehousing y sistemas distribuidos.

Además, se requiere capacidad para leer y comprender el idioma inglés puesto que una parte importante de los materiales de referencia, así como de otros recursos, están en dicho idioma.

Amunt

Algunos de los contenidos de esta asignatura deben estudiarse a partir de materiales y recursos escritos en inglés.

Amunt

  • Adquirir la destreza necesaria para la manipulación de datos, conversión de formatos y almacenamiento de los mismos.
  • Ser capaz de diseñar e implementar una infraestructura para almacenar un conjunto heterogéneo de datos, tanto en entornos centralizados como distribuidos en función del volumen y las necesidades de datos.
  • Saber utilizar el gestor de bases de datos más adecuada en cada contexto, incluyendo gestores tradicionales (relacionales básicamente) y no tradicionales (NoSQL básicamente).
  • Ser capaz de contextualizar los conceptos fundamentales de bases de datos NoSQL y ponerlos en valor.
  • Conocer los distintos modelos NoSQL: saber cómo organiza los datos cada uno de ellos y conocer sus principios básicos de diseño.
  • Saber definir modelos y hacer consultas en algunas bases de datos NoSQL concretas, señalando las características diferenciadoras de cada modelo.
  • Conocer las características principales y el funcionamiento de algunos de los productos NoSQL más relevantes.
  • Saber describir cómo las bases de datos NoSQL permiten escalar aplicaciones Big Data, haciendo referencia al teorema CAP, y entender el concepto de escalado horizontal (sharding).

Amunt

La asignatura consta de 5 bloques temáticos, que a su vez incluyen diferentes temas. El contenido asociado a cada bloque temático es el que se detalla a continuación:

Bloque 1: Preliminares

En este bloque se realizará una introducción a las características fundamentales asociadas a las bases de datos NoSQL, haciendo hincapié en su definición, motivación, características e inconvenientes, así como su contextualización en el área de las bases de datos.

Bloque 2. Modelos de datos

En este bloque se presentaran los modelos de datos más relevantes que subyacen en las bases de datos NoSQL, así como algunas consideraciones de diseño a tener en cuenta cuando trabajamos con ellos. Los modelos de datos que estudiaremos son los modelos de agregación (que incluyen, a su vez, los modelos clave-valor, documental y orientado a columnas) y los modelos orientados a grafos.

Bloque 3. Distribución de datos

Buena parte de las bases de datos NoSQL se utilizan en entornos altamente distribuidos que gestionan grandes volúmenes de datos. Por ello es necesario presentar los principales conceptos relacionados con bases de datos distribuidas. Entre estos conceptos, por una parte, se incluyen la definición de base de datos distribuida, así como aspectos relativos a su diseño. Por otra parte, se tratarán características como la consistencia y disponibilidad de los datos en entornos altamente distribuidos, y cómo éstas quedan expresadas en el teorema CAP. Para ello será necesario estudiar el modelo de transacciones ACID en el que se basan las bases de datos relacionales y el modelo BASE que subyace en algunas bases de datos NoSQL.

Bloque 4. Bases de datos NoSQL

En este bloque se examinará, para cada uno de los modelos de datos presentado en el bloque 2, un ejemplo de base de datos NoSQL, es decir, un producto comercial concreto. Los productos que se presentarán son Riak, MongoDB, Cassandra y Neo4J que constituyen ejemplos de bases de datos NoSQL clave-valor, documental y orientada a grafos, respectivamente. Asimismo se discutirán aspectos relativos a distribución de datos para alguno de los productos estudiados.

Bloque 5. Uso de bases de datos NoSQL

En el último bloque está dedicado a la consulta y actualización de datos almacenados en BD NoSQL. En concreto trabajaremos con Neo4J (una BD orientada a grafos) y MongoDB (una BD de documentos). Contaremos con el soporte de dos casos prácticos.

Amunt

BD Twiter Web
Máquina virtual Neo4j Software en línea
Máquina virtual MongoDB Software en línea
Transaction Models and Concurrency Control PDF
Caso. Diseño de una base de datos para una app de mensajería instantanea Web
Caso. Diseño de una base de datos para una app de mensajería instantanea PDF
Caso. SGBD orientados a la toma de decisiones PDF
Distributed Databases PDF

Amunt

La asignatura incluye los tipos de material siguientes:

  • Vídeos y apuntes
  • Libros de texto (más información en el apartado de "Bibliografía y fuentes de información")
  • Materiales didácticos UOC, de dos tipos:
    • Material didáctico propio de la asignatura
    • Materiales didácticos de apoyo
  • Máquinas virtuales e indicaciones instalación de software

El material principal de la asignatura son un conjunto de vídeos. Estos vídeos se asocian a los temas de la asignatura que, a su vez, se encuadran en los cinco bloques temáticos descritos en el apartado "Contenidos" de este plan docente. Para cada vídeo, a su vez, se entrega (en formato pdf) su transcripción detallada. Estas transcripciones constituyen los apuntes de la asignatura.

Aparte de los vídeos, ciertos temas tienen asociada la lectura de ciertos capítulos de un libro de texto. Este libro de texto (reseñado en el apartado "Bibliografía y fuentes de información" de este plan docente) estará disponible en línea en el aula (en el apartado "Fuentes de información").

Finalmente, también os proporcionamos diversos materiales didácticos UOC en formato pdf. En primer lugar, éste es el caso del material asociado al último bloque temático de la asignatura (Bloque 5. Uso de bases de datos NoSQL) donde se presentan dos casos prácticos, uno sobre el diseño de una BD NoSQL en grafo y otro sobre el diseño de una BD NoSQL de documentos. Estos casos prácticos se orientan, respectivamente, a facilitar el aprendizaje de Neo4J y MongoDB.

En segundo lugar, el resto de materiales didácticos UOC que se suministran (de nuevo estos materiales se describen en el apartado "Bibliografía y fuentes de información" de este plan docente), son materiales de soporte que, o bien cubren conocimientos que se presuponen en el contexto de la asignatura, o bien amplían ciertos temas tratados en la asignatura (en concreto, en los vídeos y apuntes de la asignatura y el libro de texto). La lectura de estos materiales en más o menos profundidad dependerá de vuestros conocimientos previos o de vuestro interés en profundizar en la materia de estudio.

En tercer lugar, para el aprendizaje del bloque 5 (Uso de bases de datos NoSQL), tendréis acceso a una máquina virtual para MongoDB y recibiréis las instrucciones precisas para trabajar con Neo4J.

Para acabar, es posible que sea necesario la lectura de artículos de revista (que serán suministrados desde el aula) para ampliar o complementar los contenidos de la asignatura.

Amunt

La Normativa académica de la UOC dispone que el proceso de evaluación se fundamenta en el trabajo personal del estudiante y presupone la autenticidad de la autoría y la originalidad de los ejercicios realizados.

La falta de originalidad en la autoría o el mal uso de las condiciones en las que se hace la evaluación de la asignatura es una infracción que puede tener consecuencias académicas graves.

El estudiante será calificado con un suspenso (D/0) si se detecta falta de originalidad en la autoría de alguna actividad evaluable (práctica, prueba de evaluación continua (PEC) o final (PEF), o la que se defina en el plan docente), ya sea porque ha utilizado material o dispositivos no autorizados, ya sea porque ha copiado de forma textual de internet, o ha copiado de apuntes, de materiales, manuales o artículos (sin la citación correspondiente) o de otro estudiante, o por cualquier otra conducta irregular.

La calificación de suspenso (D/0) en la evaluación continua (EC) puede conllevar la obligación de hacer el examen presencial para superar la asignatura (si hay examen y si superarlo es suficiente para superar la asignatura según indique este plan docente).

Cuando esta mala conducta se produzca durante la realización de las pruebas de evaluación finales presenciales, el estudiante puede ser expulsado del aula, y el examinador hará constar todos los elementos y la información relativos al caso.

Además, esta conducta puede dar lugar a la incoación de un procedimiento disciplinario y la aplicación, si procede, de la sanción que corresponda.

Amunt

Esta asignatura sólo puede superarse a partir de la evaluación continua (EC). La nota final de evaluación continua se convierte en la nota final de la asignatura. La fórmula de acreditación de la asignatura es la siguiente: EC.

 

Amunt