Bases de Datos NoSQL Código:  B0.478    :  6
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en el que se proyecta   Conocimientos previos   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de los que dispone la asignatura   Recursos de aprendizaje y herramientas de apoyo   Informaciones sobre la evaluación en la UOC   Consulta del modelo de evaluación  
Este es el plan docente de la asignatura. Os servirá para planificar la matrícula (consultad si la asignatura se ofrece este semestre en el espacio del Campus Más UOC / La Universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. (El plan docente puede estar sujeto a cambios).

Esta asignatura constituye una introducción a las bases de datos NoSQL. En concreto, la asignatura proporciona al estudiante una visión de los múltiples conceptos, modelos y herramientas que se pueden agrupar bajo esta denominación.

Bajo el paraguas NoSQL se incluye todo un conjunto de bases de datos, basadas en diferentes modelos de datos, que constituyen una alternativa a las bases de datos relacionales, y que son especialmente idóneas para ciertos dominios de aplicación. Entre estos dominios destacan aquéllos que trabajan con grandes volúmenes de datos que se encuentran dispersos en diferentes repositorios, aquellos dominios que trabajan con datos poco estructurados y dominios en los que se establecen múltiples y complejas interrelaciones entre los datos.

Amunt

Esta asignatura, en el contexto del Programa de Business Intelligence, forma parte de la especialidad de Gestión de datos. Esta especialidad se dirige a proporcionar al profesional de perfil tecnológico capacidades prácticas para gestionar y almacenar datos relacionales y no relacionales, así como gestionar los datos como un activo de valor por medio del gobierno de datos. Esta especialidad incluye, además de la asignatura objeto de este plan docente, las siguientes asignaturas:

  • Gobierno de datos (data governance): en esta asignatura, el estudiante se familiariza con el gobierno de datos, una práctica que une personas, procesos y tecnología para cambiar la forma en que los datos son adquiridos, gestionados, mantenidos, transformados en información, compartidos en el contexto de la organización como conocimiento común y sistemáticamente obtenidos por la empresa para mejorar la rentabilidad. El estudiante trabaja con herramientas ofimáticas (DOC, XLS, PPT) y con herramientas especializadas para el desarrollo de un programa de gobierno de datos (Trifacta o Talend).
  • Bases de datos analíticos: en esta asignatura se aprende a crear un almacén de datos adecuado que ofrezca apoyo en la toma de decisiones de la organización. Se presenta de manera conceptual la arquitectura de almacenamiento (data warehousing) y se dan pautas para construir este tipo de sistemas. La puesta en práctica se lleva a cabo mediante la resolución de un caso práctico extenso para el que se usan varias herramientas especializadas (Pentaho, Microsoft, Oracle y PostgreSQL).

Amunt

La asignatura os proporcionará conocimientos que serán de utilidad en diferentes ámbitos profesionales, como son la dirección de proyectos BI, la consultoría en proyectos/productos BI, la programación de sistemas de BI, el diseño de bases de datos o la ciencia de datos, entre otros.

Amunt

El curso requiere que los estudiantes tengan la capacidad de leer y comprender el idioma inglés puesto que una parte importante de los materiales de referencia, así como de otros recursos, están en dicho idioma. Asimismo también es deseable que los estudiantes tengan conocimientos de bases de datos relacionales.

Amunt

  • Ser capaz de situar, en el contexto del área de bases de datos, los términos más habituales del área de NoSQL (agregado, clave-valor, documento, columna, grafo, sharding, réplica, ACID, BASE, teorema CAP, MapReduce, base de datos distribuida, modelos de sistemas distribuidos etc.).
  • Conocer los distintos modelos NoSQL (clave-valor, documental, columnas y de grafo), saber cómo organiza los datos cada uno de ellos y conocer sus principios básicos de diseño.
  • Ser consciente de las implicaciones de la distribución de datos para las bases de datos y entender el impacto que tiene dicha distribución en las bases de datos NoSQL.
  • Ser capaz de escoger el mejor modelo de datos para cada problema concreto, o la combinación de ellos en un proyecto informático.
  • Conocer las características principales y el funcionamiento de algunos de los productos NoSQL más relevantes.
  • Ser capaz de consultar y actualizar los datos de una base de datos en grafo (Neo4J) y de una base de datos de documentos (MongoDB).

Amunt

La asignatura consta de 5 bloques temáticos, que a su vez incluyen diferentes temas. En el documento "Contenidos, planificación y actividades evaluables" que el equipo docente hará llegar a través del Tablón de la asignatura tenéis la relación de temas incluidos en cada bloque temático.

El contenido asociado a cada bloque temático es el que se detalla a continuación:

Bloque 1: Preliminares

En este bloque se realizará una introducción a las características fundamentales asociadas a las bases de datos NoSQL, haciendo hincapié en su definición, motivación, características e inconvenientes, así como su contextualización en el área de las bases de datos.

Bloque 2. Modelos de datos

En este bloque se presentaran los modelos de datos más relevantes que subyacen en las bases de datos NoSQL, así como algunas consideraciones de diseño a tener en cuenta cuando trabajamos con ellos. Los modelos de datos que estudiaremos son los modelos de agregación (que incluyen, a su vez, los modelos clave-valor, documental y orientado a columnas) y los modelos orientados a grafos.

Bloque 3. Distribución de datos

Buena parte de las bases de datos NoSQL se utilizan en entornos altamente distribuidos que gestionan grandes volúmenes de datos. Por ello es necesario presentar los principales conceptos relacionados con bases de datos distribuidas. Entre estos conceptos, por una parte, se incluyen la definición de base de datos distribuida, así como aspectos relativos a su diseño. Por otra parte, se tratarán características como la consistencia y disponibilidad de los datos en entornos altamente distribuidos, y cómo éstas quedan expresadas en el teorema CAP. Para ello será necesario estudiar el modelo de transacciones ACID en el que se basan las bases de datos relacionales y el modelo BASE que subyace en algunas bases de datos NoSQL.

Bloque 4. Bases de datos NoSQL

En este bloque se examinará, para cada uno de los modelos de datos presentado en el bloque 2, un ejemplo de base de datos NoSQL, es decir, un producto comercial concreto. Los productos que se presentarán son Riak, MongoDB y Neo4J que constituyen ejemplos de bases de datos NoSQL clave-valor, documental y orientada a grafos, respectivamente. Asimismo se discutirán aspectos relativos a distribución de datos para alguno de los productos estudiados.

Bloque 5. Uso de bases de datos NoSQL

En el último bloque está dedicado a la consulta y actualización de datos almacenados en BD NoSQL. En concreto trabajaremos con Neo4J (una BD orientada a grafos) y MongoDB (una BD de documentos). Contaremos con el soporte de dos casos prácticos.

Amunt

Caso. SGBD orientados a la toma de decisiones PDF
BD Twiter Web
Distributed Databases PDF
Transaction Models and Concurrency Control PDF
Máquina virtual Linux Mint Software en línea
Máquina virtual Linux Mint (Manual) PDF
Espacio de recursos de ciencia de datos Web

Amunt

La asignatura incluye los tipos de material siguientes:

  • Vídeos y apuntes
  • Libros de texto (más información en el apartado de "Bibliografía y fuentes de información")
  • Materiales didácticos UOC, de dos tipos:
    • Material didáctico propio de la asignatura
    • Materiales didácticos de apoyo
  • Máquinas virtuales e indicaciones instalación de software

El material principal de la asignatura son un conjunto de vídeos. Estos vídeos se asocian a los temas de la asignatura que, a su vez, se encuadran en los cinco bloques temáticos descritos en el apartado "Contenidos" de este plan docente. Para cada vídeo, a su vez, se entrega (en formato pdf) su transcripción detallada. Estas transcripciones constituyen los apuntes de la asignatura.

Aparte de los vídeos, ciertos temas tienen asociada la lectura de ciertos capítulos de un libro de texto. Este libro de texto (reseñado en el apartado "Bibliografía y fuentes de información" de este plan docente) estará disponible en línea en el aula (en el apartado "Fuentes de información").

Finalmente, también os proporcionamos diversos materiales didácticos UOC en formato pdf. En primer lugar, éste es el caso del material asociado al último bloque temático de la asignatura (Bloque 5. Uso de bases de datos NoSQL) donde se presentan dos casos prácticos, uno sobre el diseño de una BD NoSQL en grafo y otro sobre el diseño de una BD NoSQL de documentos. Estos casos prácticos se orientan, respectivamente, a facilitar el aprendizaje de Neo4J y MongoDB.

En segundo lugar, el resto de materiales didácticos UOC que se suministran (de nuevo estos materiales se describen en el apartado "Bibliografía y fuentes de información" de este plan docente), son materiales de soporte que, o bien cubren conocimientos que se presuponen en el contexto de la asignatura, o bien amplían ciertos temas tratados en la asignatura (en concreto, en los vídeos y apuntes de la asignatura y el libro de texto). La lectura de estos materiales es optativa, y dependerá de vuestros conocimientos previos o de vuestro interés en profundizar en la materia de estudio.

En tercer lugar, para el aprendizaje del bloque 5 (Uso de bases de datos NoSQL), tendréis acceso a dos máquinas virtuales, una para MongoDB y la otra para trabajar con Neo4J. En ambos casos recibiréis instrucciones precisas sobre cómo usarlas.

Para acabar, es posible que sea necesario la lectura de artículos de revista (que serán suministrados desde el aula) para ampliar o complementar los contenidos de la asignatura

En el documento "Contenidos, planificación y actividades evaluables" que el equipo docente hará llegar a través del Tablón de la asignatura tenéis la relación completa de qué material debéis usar en cada momento. En ese mismo documento se proporciona una planificación semanal del estudio de la asignatura.

Amunt

El proceso de evaluación se fundamenta en el trabajo personal de cada estudiante y presupone la autenticidad de la autoría y la originalidad de los ejercicios realizados.

La falta de autenticidad en la autoría o de originalidad de las pruebas de evaluación; la copia o el plagio; el intento fraudulento de obtener un resultado académico mejor; la colaboración, el encubrimiento o el favorecimiento de la copia, o la utilización de material o dispositivos no autorizados durante la evaluación, entre otras, son conductas irregulares que pueden tener consecuencias académicas y disciplinarias graves.

Por un lado, si se detecta alguna de estas conductas irregulares, puede comportar el suspenso (D/0) en las actividades evaluables que se definan en el plan docente –incluidas las pruebas finales– o en la calificación final de la asignatura, ya sea porque se han utilizado materiales o dispositivos no autorizados durante las pruebas, como redes sociales o buscadores de información en internet, porque se han copiado fragmentos de texto de una fuente externa (internet, apuntes, libros, artículos, trabajos o pruebas del resto de estudiantes, etc.) sin la correspondiente citación, o porque se ha practicado cualquier otra conducta irregular.

Por el otro, y de acuerdo con las normativas académicas, las conductas irregulares en la evaluación, además de comportar el suspenso de la asignatura, pueden dar lugar a la incoación de un procedimiento disciplinario y a la aplicación, si procede, de la sanción que corresponda.

Amunt

Esta asignatura sólo puede superarse a partir de la evaluación continua (EC). La nota final de evaluación continua se convierte en la nota final de la asignatura. La fórmula de acreditación de la asignatura es la siguiente: EC.

 

Amunt