Arquitecturas de bases de datos no relacionales Código:  M2.889    :  6
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en el que se proyecta   Conocimientos previos   Información previa a la matrícula   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de la UOC para la asignatura   Información adicional sobre los recursos de aprendizaje y herramientas de apoyo   Informaciones sobre la evaluación en la UOC   Consulta del modelo de evaluación  
Este es el plan docente de la asignatura para el segundo semestre del curso 2023-2024. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

Esta asignatura constituye una introducción a las bases de datos NoSQL. En concreto, la asignatura proporciona al estudiante una visión de los múltiples conceptos, modelos y herramientas que se pueden agrupar bajo esta denominación.

Bajo el paraguas NoSQL se incluye todo un conjunto de bases de datos, basadas en diferentes modelos de datos, que constituyen una alternativa a las bases de datos relacionales, y que son especialmente idóneas para ciertos dominios de aplicación. Entre estos dominios destacan aquéllos que trabajan con grandes volúmenes de datos que se encuentran dispersos en diferentes repositorios, aquellos dominios que trabajan con datos poco estructurados y dominios en los que se establecen múltiples y complejas interrelaciones entre los datos.

Amunt

Esta asignatura forma parte del conjunto de asignaturas obligatorias del máster, y se recomienda que sea cursada durante el segundo semestre de estudios.

Amunt

El objetivo del máster de Data Science de la UOC es la formación de profesionales todo-terreno con una formación en análisis y solución de problemas de negocio, estadística avanzada y minería de datos y diseño y construcción de sistemas de información, que pueden trabajar en diferentes departamentos de la empresa o en un centro de competencias transversal. Los conocimientos y habilidades desarrollados en esta asignatura serán de especial utilidad en el almacenamiento y tratamiento de datos complejos (por su estructura, volumen, frecuéncia, tamaño, etc.) y en el diseño e implementación de sistemas que requieran distribución y/o replicación de datos.

Amunt

Son necesarios conocimientos de bases de datos relacionales y de SQL. Es recomendable disponer de conocimientos de data warehousing y sistemas distribuidos.

Además, se requiere capacidad para leer y comprender el idioma inglés puesto que una parte importante de los materiales de referencia, así como de otros recursos, están en dicho idioma.

Amunt

Algunos de los contenidos de esta asignatura deben estudiarse a partir de materiales y recursos escritos en inglés.

Amunt

  • Adquirir la destreza necesaria para la manipulación de datos, conversión de formatos y almacenamiento de los mismos.
  • Ser capaz de diseñar e implementar una infraestructura para almacenar un conjunto heterogéneo de datos, tanto en entornos centralizados como distribuidos en función del volumen y las necesidades de datos.
  • Saber utilizar el gestor de bases de datos más adecuada en cada contexto, incluyendo gestores tradicionales (relacionales básicamente) y no tradicionales (NoSQL básicamente).
  • Ser capaz de contextualizar los conceptos fundamentales de bases de datos NoSQL y ponerlos en valor.
  • Conocer los distintos modelos NoSQL: saber cómo organiza los datos cada uno de ellos y conocer sus principios básicos de diseño.
  • Saber definir modelos y hacer consultas en algunas bases de datos NoSQL concretas, señalando las características diferenciadoras de cada modelo.
  • Conocer las características principales y el funcionamiento de algunos de los productos NoSQL más relevantes.
  • Saber describir cómo las bases de datos NoSQL permiten escalar aplicaciones Big Data, haciendo referencia al teorema CAP, y entender el concepto de escalado horizontal (sharding).

Amunt

La asignatura consta de 5 bloques temáticos, que a su vez incluyen diferentes temas. El contenido asociado a cada bloque temático es el que se detalla a continuación:

Bloque 1: Preliminares

En este bloque se realizará una introducción a las características fundamentales asociadas a las bases de datos NoSQL, haciendo hincapié en su definición, motivación, características e inconvenientes, así como su contextualización en el área de las bases de datos.

Bloque 2. Modelos de datos

En este bloque se presentaran los modelos de datos más relevantes que subyacen en las bases de datos NoSQL, así como algunas consideraciones de diseño a tener en cuenta cuando trabajamos con ellos. Los modelos de datos que estudiaremos son los modelos de agregación (que incluyen, a su vez, los modelos clave-valor, documental y orientado a columnas) y los modelos orientados a grafos.

Bloque 3. Distribución de datos

Buena parte de las bases de datos NoSQL se utilizan en entornos altamente distribuidos que gestionan grandes volúmenes de datos. Por ello es necesario presentar los principales conceptos relacionados con bases de datos distribuidas. Entre estos conceptos, por una parte, se incluyen la definición de base de datos distribuida, así como aspectos relativos a su diseño. Por otra parte, se tratarán características como la consistencia y disponibilidad de los datos en entornos altamente distribuidos, y cómo éstas quedan expresadas en el teorema CAP. Para ello será necesario estudiar el modelo de transacciones ACID en el que se basan las bases de datos relacionales y el modelo BASE que subyace en algunas bases de datos NoSQL.

Bloque 4. Bases de datos NoSQL

En este bloque se examinará, para cada uno de los modelos de datos presentado en el bloque 2, un ejemplo de base de datos NoSQL, es decir, un producto comercial concreto. Los productos que se presentarán son Riak, MongoDB, Cassandra y Neo4J que constituyen ejemplos de bases de datos NoSQL clave-valor, documental y orientada a grafos, respectivamente. Asimismo se discutirán aspectos relativos a distribución de datos para alguno de los productos estudiados.

Bloque 5. Uso de bases de datos NoSQL

En el último bloque está dedicado a la consulta y actualización de datos almacenados en BD NoSQL. En concreto trabajaremos con Neo4J (una BD orientada a grafos), Cassandra (una BD orientada a grandes columnas) y MongoDB (una BD de documentos). Contaremos con el soporte de dos casos prácticos.

Amunt

BD Twiter Web
Distributed Databases PDF
Transaction Models and Concurrency Control PDF
Espacio de recursos de ciencia de datos Web
MV Bases de dades NoSQL Software en línea
Bases de datos NoSQL. Uso de máquina virtual PDF

Amunt

La asignatura incluye los tipos de material siguientes:

  • Vídeos y apuntes
  • Libros de texto (más información en el apartado de "Bibliografía y fuentes de información")
  • Materiales didácticos UOC, de dos tipos:
    • Material didáctico propio de la asignatura
    • Materiales didácticos de apoyo
  • Máquinas virtuales e indicaciones instalación de software

El material principal de la asignatura son un conjunto de vídeos. Estos vídeos se asocian a los temas de la asignatura que, a su vez, se encuadran en los cinco bloques temáticos descritos en el apartado "Contenidos" de este plan docente. Para cada vídeo, a su vez, se entrega (en formato pdf) su transcripción detallada. Estas transcripciones constituyen los apuntes de la asignatura.

Aparte de los vídeos, ciertos temas tienen asociada la lectura de ciertos capítulos de un libro de texto. Este libro de texto (reseñado en el apartado "Bibliografía y fuentes de información" de este plan docente) estará disponible en línea en el aula (en el apartado "Fuentes de información").

Finalmente, también os proporcionamos diversos materiales didácticos UOC en formato pdf. En primer lugar, éste es el caso del material asociado al último bloque temático de la asignatura (Bloque 5. Uso de bases de datos NoSQL) donde se presentan dos casos prácticos, uno sobre el diseño de una BD NoSQL en grafo y otro sobre el diseño de una BD NoSQL de documentos. Estos casos prácticos se orientan, respectivamente, a facilitar el aprendizaje de Neo4J y MongoDB.

En segundo lugar, el resto de materiales didácticos UOC que se suministran (de nuevo estos materiales se describen en el apartado "Bibliografía y fuentes de información" de este plan docente), son materiales de soporte que, o bien cubren conocimientos que se presuponen en el contexto de la asignatura, o bien amplían ciertos temas tratados en la asignatura (en concreto, en los vídeos y apuntes de la asignatura y el libro de texto). La lectura de estos materiales en más o menos profundidad dependerá de vuestros conocimientos previos o de vuestro interés en profundizar en la materia de estudio.

En tercer lugar, para el aprendizaje del bloque 5 (Uso de bases de datos NoSQL), tendréis acceso a una máquina virtual para MongoDB y recibiréis las instrucciones precisas para trabajar con Neo4J.

Para acabar, es posible que sea necesario la lectura de artículos de revista (que serán suministrados desde el aula) para ampliar o complementar los contenidos de la asignatura.

Amunt

En la UOC, la evaluación generalmente es virtual. Se estructura en torno a la evaluación continua, que incluye diferentes actividades o retos; la evaluación final, que se lleva a cabo mediante pruebas o exámenes, y el trabajo final de la titulación.

Las actividades o pruebas de evaluación pueden ser escritas y/o audiovisuales, con preguntas aleatorias, pruebas orales síncronas o asíncronas, etc., de acuerdo con lo que decida cada equipo docente. Los trabajos finales representan el cierre de un proceso formativo que implica la realización de un trabajo original y tutorizado que tiene como objetivo demostrar la adquisición competencial hecha a lo largo del programa.

Para verificar la identidad del estudiante y la autoría de las pruebas de evaluación, la UOC se reserva la potestad de aplicar diferentes sistemas de reconocimiento de la identidad y de detección del plagio. Con este objetivo, la UOC puede llevar a cabo grabación audiovisual o usar métodos o técnicas de supervisión durante la ejecución de cualquier actividad académica.

Asimismo, la UOC puede exigir al estudiante el uso de dispositivos electrónicos (micrófonos, cámaras u otras herramientas) o software específico durante la evaluación. Es responsabilidad del estudiante asegurar que estos dispositivos funcionan correctamente.

El proceso de evaluación se fundamenta en el trabajo personal del estudiante y presupone la autenticidad de la autoría y la originalidad de las actividades académicas. La web sobre integridad académica y plagio de la UOC contiene información al respecto.

La falta de autenticidad en la autoría o de originalidad de las pruebas de evaluación; la copia o el plagio; la suplantación de identidad; la aceptación o la obtención de cualquier actividad académica a cambio o no de una contraprestación; la colaboración, el encubrimiento o el favorecimiento de la copia, o el uso de material, software o dispositivos no autorizados en el plan docente o el enunciado de la actividad académica, incluida la inteligencia artificial y la traducción automática, entre otras, son conductas irregulares en la evaluación que pueden tener consecuencias académicas y disciplinarias graves.

Estas conductas irregulares pueden conllevar el suspenso (D/0) en las actividades evaluables definidas en el plan docente -incluidas las pruebas finales- o en la calificación final de la asignatura, ya sea porque se han utilizado materiales, software o dispositivos no autorizados durante las pruebas (como el uso de inteligencia artificial no permitida, redes sociales o buscadores de información en internet), porque se han copiado fragmentos de texto de una fuente externa (internet, apuntes, libros, artículos, trabajos o pruebas de otros estudiantes, etc.) sin la citación correspondiente, por la compraventa de actividades académicas, o porque se ha llevado a cabo cualquier otra conducta irregular.

Asimismo, y de acuerdo con la normativa académica, las conductas irregulares en la evaluación también pueden dar lugar a la incoación de un procedimiento disciplinario y a la aplicación, si procede, de la sanción que corresponda, de conformidad con lo establecido en la normativa de convivencia de la UOC.

En el marco del proceso de evaluación, la UOC se reserva la potestad de:

  • Solicitar al estudiante que acredite su identidad según lo establecido en la normativa académica.
  • Solicitar al estudiante que acredite la autoría de su trabajo a lo largo de todo el proceso de evaluación, tanto en la evaluación continua como en la evaluación final, a través de una entrevista oral síncrona, que puede ser objeto de grabación audiovisual, o por los medios establecidos por la UOC. Estos medios tienen el objetivo de verificar los conocimientos y las competencias que garanticen la identidad del estudiante. Si no es posible garantizar que el estudiante es el autor de la prueba, esta puede ser calificada con una D, en el caso de la evaluación continua, o con un suspenso, en el caso de la evaluación final.

Inteligencia artificial en el marco de la evaluación

La UOC reconoce el valor y el potencial de la inteligencia artificial (IA) en el ámbito educativo y, a su vez, pone de manifiesto los riesgos que supone si no se utiliza de forma ética, crítica y responsable. En este sentido, en cada actividad de evaluación se informará al estudiantado sobre las herramientas y los recursos de IA que se pueden utilizar y en qué condiciones. Por su parte, el estudiantado se compromete a seguir las indicaciones de la UOC a la hora de realizar las actividades de evaluación y de citar las herramientas utilizadas y, concretamente, a identificar los textos o imágenes generados por sistemas de IA, los cuales no podrá presentar como si fueran propios.

Respecto a usar o no la IA para resolver una actividad, el enunciado de las actividades de evaluación indica las limitaciones en el uso de estas herramientas. Debe tenerse en cuenta que usarlas de manera inadecuada, como por ejemplo en actividades en las que no están permitidas o no citarlas en las actividades en las que sí lo están, puede considerarse una conducta irregular en la evaluación. En caso de duda, se recomienda que, antes entregar la actividad, se haga llegar una consulta al profesorado colaborador del aula.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.

 

Amunt