Software para el análisis de datos Código:  M0.153    :  5
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en el que se proyecta   Conocimientos previos   Información previa a la matrícula   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de la UOC para la asignatura   Información adicional sobre los recursos de aprendizaje y herramientas de apoyo   Informaciones sobre la evaluación en la UOC   Consulta del modelo de evaluación  
Este es el plan docente de la asignatura para el segundo semestre del curso 2023-2024. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

La asignatura de Software para el Análisis de Datos se centra en el aprendizaje y manejo del paquete estadístico R y herramientas relacionadas.

- Paquete estadístico R: El paquete estadístico R uno de los más flexibles y potentes para el tratamiento y análisis de los datos, desde los más elementales a los más avanzados. Este software está desarrollado y mantenido por la comunidad científica internacional. Es, además, un programa gratuito, libre y se descarga de forma fácil y segura.

- R-Commander: R-Comander es una Interfaz Gráfica de Usuario (GUI) del programa R. 

- RStudio: R-Studio es el entorno de desarrollo (IDE) de R.

- RMarkdown: Extensión de Markdown para R, funcionalidad que permite convertir (de manera rápida y sencilla) texto plano a un formato de máxima legibilidad y facilidad de publicación.

Amunt

La asignatura introduce al alumno al manejo y uso a nivel principiante y medio del lenguaje de programación R. 

Para ello se introducen tareas sencillas para el manejo de datos estadísticos, la simulación de variables aleatorias en los casos univariantes y multivariantes, la representación gráfica y la programación de tareas estadísticas con R.

Esta asignatura está incluida en el plan de estudios del Máster en Bioinformática y Bioestadística, por lo que los ejemplos y ejercicios se intentará que se enmarquen en el campo de las ciencias de la vida y la salud.

Amunt

Al final de la asignatura, el estudiante será capaz de manejar datos univariantes y multivariantes así como el almacenamiento de datos, recuperación y estructuras de datos y las representaciones gráficas de éstos. También a programar funciones de dificultad media con R. 

Además, estará capacitado para simular variables aleatorias, programar diferentes rutinas estadísticas y repasar algunas operaciones algebraicas de uso habitual.

Amunt

No son necesarios conocimientos previos específicos, sólo los generales del curso: comprensión lectora en inglés y conocimientos básicos de Álgebra Lineal y Estadística.

Se deberá tener una base de estadística descriptiva e inferencia y, también, un buen manejo de las herramientas informáticas y conocimiento básico de algún lenguaje de programación. 

Amunt

* Restricciones de acceso: No hay restricciones de acceso

* Recomendaciones de acceso: Idealmente esta asignatura se debería cursar el primer semestre del Máster.

Amunt

Esta asignatura pretende dar a conocer R a nivel intermedio. Como resultado de este aprendizaje, se espera que el estudiantes adquieran las siguientes capacidades: 

  1.  Aprender a usar R como Software Estadístico libre.
  2.  Aprendrer a usar las principales interfaces, IDEs y herramientas de R (R Commander, R Studio, RMarkdown etc.)
  3.  Aprender a usar R como lenguaje de programación.
  4.  Aprender a usar las librerias de R asociadas a los contenidos Bio.

En el contexto general del Máster en Bioinformática i Bioestadística, se concreta con las siguientes competencias:

Competencias básicas generales:

  • Todas las competencias básicas del Máster.
  • Todas las competencias generales del Máster. 

Competencias transversales:

  • CT1- Capacidad de iniciativa, automotivación  y trabajo de forma independiente.
  • CT3- Capacidad para proponer soluciones innovadoras y ayuda a la toma de decisiones.
  • CT5- Capacidad para la comprensión, el análisis y la síntesis de conceptos.

 
Competencias especificas:

  • CE2- Adquirir las habilidades técnicas apropiadas para la bioinformáticas, como son la programación, la creación y la gestión de BD.
  • CE3- Conocer los principios básicos de la inferencia estadística y entender su papel fundamental.
  • CE4- Conocer los principales métodos de regresión que sean adecuados a las diferentes tipologías de datos.  
  • CE6- Adquirir la capacidad de manejar, gestionar, interpretar y analizar grandes volúmenes de datos usando software estadístico adecuado como el lenguaje estadístico R.
  • CE8- Conocer las herramientas del programa estadístico adecuados para los diferentes problemas de modelización y análisis de datos.
  • CE13- Conocer los aspectos éticos y legales relacionados con el desarrollo de productos en el ámbito de la Bioestadística.

Amunt

De forma genérica, los contenidos que trabajamos son los siguientes:

  • Instalación y configuración de R, RStudio y R Markdown.
  • Uso de R como herramienta para el análisis de datos en bioinformática y bioestadística.
  • Uso de R como lenguaje de programación en  bioinformática y bioestadística.
  • Principales paquetes (librerías) de R en bioinformática y bioestadística.

Contenidos detallados del curso:

1. Introducción al lenguaje de programación R, Rstudio y R Markdown.

1.1 Instalación de R y Rstudio

1.2 Interfaz de R y Rstudio

1.3 Introducción a R Markdown

1.4 Gestión de paquetes en R

1.5 Importación de datos en R y Rstudio

1.6 Exportación de datos en R

1.7 Estructura de datos en R

1.8 Conjuntos de datos

1.9 Visualización de los datos en R. Gráficas base

2. Estadística descriptiva y gráficos con R.

2.1 Resumen de datos y variable en R

2.2 Etiquetar y recodificar en R

2.3 Tablas de frecuencias con R

2.4 Gráficos básicos en R

2.5 Paquete ggplot2 para la creación de gráficos

2.6 Guardar y exportar gráficos en R

2.7 Regresión lineal con R

2.8 ANOVA

3. Fundamentos de programación y acceso a base de datos en R.

3.1 Elementos básicos de R: operadores, variables y tipos de datos

3.2 Estructuras de datos

3.3 Instrucciones básicas del lenguaje R 

3.4 Funciones en R

3.5 Acceso a bases de datos en R

4. Probabilidad y simulación con R.

4.1 Probabilidad con R

4.2 Distribuciones de probabilidad

4.3 Tipos de distribuciones usadas en probabilidad

4.4 Simulación con R

4.5 Muestreo

5. Introducción al machine learning con R

5.1 Conceptos básicos del aprendizaje automatizado (machine learning)

5.2 Aprendizaje supervisado con R

5.3 Aprendizaje no supervisado con R

5.4 Aprendizaje profundo (deep learning) con R

5.5 Análisis de varianza (ANOVA)

6. Paquetes de R para la bioinformática

6.1 Ecosistema de R: Entornos reproducibles y visualización de datos con Shiny

6.2 Bioconductor, un proyecto de código abierto para bioinformática

6.3 Aplicación al ámbito biosanitario de algunos paquetes relevantes de R

Amunt

Introducción al lenguaje R, Rstudio y R Markdown PDF
Introducció al llenguatge R, RStudio y R Markdown PDF
Estadística descriptiva y gráficos con R PDF
Estadística descriptiva i gràfics amb R PDF
Fundamentos de programación y acceso a base de datos en R PDF
Fonaments de programació i accés a base de dades en R PDF
Probabilidad y simulación con R PDF
Probabilitat i simulació amb R PDF
Introducción al machine learning con R PDF
Introducció al machine learning amb R PDF
Paquetes de R para la bioinformática PDF
Paquets de R per a la bioinformàtica PDF

Amunt

Materiales básicos:

W. J. Braun, D. J. Murdoch. A First Course in Statistical Programming with R (e-book).

J. Abedin. Data Manipulation with R.

Crawley, M (2009). The R Book.

Materiales complementarios:

Mathur (2010). Statistical Bioinformatics with R.

Logan, M. (2010). Biostatistical Design and Analysis Using R: A Practical Guide.

H. Wickham, G. Grolemund (2017). R for data science.

Estos recursos de aprendizaje están disponibles en la biblioteca de la UOC.  En los espacios de recursos del aula y en los documentos correspondientes a los laboratorios (LAB) se referenciaran otros materiales de interés.

Amunt

En la UOC, la evaluación generalmente es virtual. Se estructura en torno a la evaluación continua, que incluye diferentes actividades o retos; la evaluación final, que se lleva a cabo mediante pruebas o exámenes, y el trabajo final de la titulación.

Las actividades o pruebas de evaluación pueden ser escritas y/o audiovisuales, con preguntas aleatorias, pruebas orales síncronas o asíncronas, etc., de acuerdo con lo que decida cada equipo docente. Los trabajos finales representan el cierre de un proceso formativo que implica la realización de un trabajo original y tutorizado que tiene como objetivo demostrar la adquisición competencial hecha a lo largo del programa.

Para verificar la identidad del estudiante y la autoría de las pruebas de evaluación, la UOC se reserva la potestad de aplicar diferentes sistemas de reconocimiento de la identidad y de detección del plagio. Con este objetivo, la UOC puede llevar a cabo grabación audiovisual o usar métodos o técnicas de supervisión durante la ejecución de cualquier actividad académica.

Asimismo, la UOC puede exigir al estudiante el uso de dispositivos electrónicos (micrófonos, cámaras u otras herramientas) o software específico durante la evaluación. Es responsabilidad del estudiante asegurar que estos dispositivos funcionan correctamente.

El proceso de evaluación se fundamenta en el trabajo personal del estudiante y presupone la autenticidad de la autoría y la originalidad de las actividades académicas. La web sobre integridad académica y plagio de la UOC contiene información al respecto.

La falta de autenticidad en la autoría o de originalidad de las pruebas de evaluación; la copia o el plagio; la suplantación de identidad; la aceptación o la obtención de cualquier actividad académica a cambio o no de una contraprestación; la colaboración, el encubrimiento o el favorecimiento de la copia, o el uso de material, software o dispositivos no autorizados en el plan docente o el enunciado de la actividad académica, incluida la inteligencia artificial y la traducción automática, entre otras, son conductas irregulares en la evaluación que pueden tener consecuencias académicas y disciplinarias graves.

Estas conductas irregulares pueden conllevar el suspenso (D/0) en las actividades evaluables definidas en el plan docente -incluidas las pruebas finales- o en la calificación final de la asignatura, ya sea porque se han utilizado materiales, software o dispositivos no autorizados durante las pruebas (como el uso de inteligencia artificial no permitida, redes sociales o buscadores de información en internet), porque se han copiado fragmentos de texto de una fuente externa (internet, apuntes, libros, artículos, trabajos o pruebas de otros estudiantes, etc.) sin la citación correspondiente, por la compraventa de actividades académicas, o porque se ha llevado a cabo cualquier otra conducta irregular.

Asimismo, y de acuerdo con la normativa académica, las conductas irregulares en la evaluación también pueden dar lugar a la incoación de un procedimiento disciplinario y a la aplicación, si procede, de la sanción que corresponda, de conformidad con lo establecido en la normativa de convivencia de la UOC.

En el marco del proceso de evaluación, la UOC se reserva la potestad de:

  • Solicitar al estudiante que acredite su identidad según lo establecido en la normativa académica.
  • Solicitar al estudiante que acredite la autoría de su trabajo a lo largo de todo el proceso de evaluación, tanto en la evaluación continua como en la evaluación final, a través de una entrevista oral síncrona, que puede ser objeto de grabación audiovisual, o por los medios establecidos por la UOC. Estos medios tienen el objetivo de verificar los conocimientos y las competencias que garanticen la identidad del estudiante. Si no es posible garantizar que el estudiante es el autor de la prueba, esta puede ser calificada con una D, en el caso de la evaluación continua, o con un suspenso, en el caso de la evaluación final.

Inteligencia artificial en el marco de la evaluación

La UOC reconoce el valor y el potencial de la inteligencia artificial (IA) en el ámbito educativo y, a su vez, pone de manifiesto los riesgos que supone si no se utiliza de forma ética, crítica y responsable. En este sentido, en cada actividad de evaluación se informará al estudiantado sobre las herramientas y los recursos de IA que se pueden utilizar y en qué condiciones. Por su parte, el estudiantado se compromete a seguir las indicaciones de la UOC a la hora de realizar las actividades de evaluación y de citar las herramientas utilizadas y, concretamente, a identificar los textos o imágenes generados por sistemas de IA, los cuales no podrá presentar como si fueran propios.

Respecto a usar o no la IA para resolver una actividad, el enunciado de las actividades de evaluación indica las limitaciones en el uso de estas herramientas. Debe tenerse en cuenta que usarlas de manera inadecuada, como por ejemplo en actividades en las que no están permitidas o no citarlas en las actividades en las que sí lo están, puede considerarse una conducta irregular en la evaluación. En caso de duda, se recomienda que, antes entregar la actividad, se haga llegar una consulta al profesorado colaborador del aula.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.

 

Amunt