Programari per a l'anàlisi de dades Codi:  M0.153    :  5
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Camps professionals en què es projecta   Coneixements previs   Objectius i competències   Continguts   Consulta dels recursos d'aprenentatge de què disposa l'assignatura   Recursos d'aprenentatge i eines de suport   Informacions sobre l'avaluació a la UOC   Consulta del model d'avaluació  
Aquest és el pla docent de l'assignatura. Us servirà per planificar la matrícula (consulteu si l'assignatura s'ofereix aquest semestre a l'espai del Campus Més UOC / La Universitat / Plans d'estudis). Un cop comenci la docència, heu de consultar-lo a l'aula. (El pla docent pot estar subjecte a canvis.)

Català: 

L'assignatura de Programari per a l'Anàlisi de Dades se centra en l'aprenentatge i maneig del paquet estadístic R.

- Paquet estadístic R: El paquet estadístic R és un dels més flexibles i potents per al tractament i anàlisi de les dades, des dels més elementals als més avançats. Aquest programari està desenvolupat i mantingut per la comunitat científica internacional. És, a més, un programa gratuït i es descarrega de forma fàcil i segura.

Castellano:

La asignatura de Software para el Análisis de Datos se centra en el aprendizaje y manejo del paquete estadístico R.

- Paquete estadístico R: El paquete estadístico R es uno de los más flexibles y potentes para el tratamiento y análisis de los datos, de los más elementales a los más avanzados. Este software está desarrollado y mantenido por la comunidad científica internacional. Es además un programa gratuito y se descarga de forma fácil y segura.

Amunt

Català:

L'assignatura introdueix a l'alumne al maneig i ús a nivell principiant/mitjà del paquet R.

Per a això s'introdueixen tasques senzilles per al maneig de dades estadístiques, la simulació de variables aleatòries en els casos univariables i multivariants, el maneig de bases de dades, la representació gràfica i la programació de tasques estadístiques amb el llenguatge de programació inclòs en R.

Aquesta assignatura està inclosa en el pla d'estudis del Màster en Bioinformàtica i Bioestadística, per la qual cosa els exemples i exercicis s'emmarcaran en el camp de les ciències de la vida i la salut.

Castellano:

La asignatura introduce al alumno en el manejo y uso a nivel principiante/medio del paquete R. Para ello se introducen tareas sencillas para el manejo de datos estadísticos, la simulación de variables aleatorias en los casos univariables y multivariantes, el manejo de bases de datos, la representación gráfica y la programación de tareas estadísticas con el lenguaje de programación incluido en R.

Esta asignatura está incluida en el plan de estudios del Máster en Bioinformática y Bioestadística, por lo que los ejemplos y ejercicios se enmarcarán en el campo de las ciencias de la vida y la salud.

Amunt

Català:

Al final de l'assignatura, l'alumne serà capaç de realitzar operacions de maneig de dades univariables i multivariants, incloent emmagatzematge, recuperació, creació d'estructures de dades i representació gràfica dels mateixos. A més, estarà capacitat per simular variables aleatòries, programar diferents rutines estadístiques i repassar algunes operacions algebraiques. Tot això servirà per programar i analitzar dades en qualsevol àmbit, en particular l'àmbit de la Bioinformàtica i la Bioestadística.

Castellano:

Al final de la asignatura, el alumno será capaz de realizar operaciones de manejo de datos univariables y multivariantes, incluyendo almacenamiento, recuperación, creación de estructuras de datos y representación gráfica de los mismos. Además, estará capacitado para simular variables aleatorias, programar diferentes rutinas estadísticas y repasar algunas operaciones algebraicas. Todo esto servirá para programar y analizar datos en cualquier ámbito, en particular el ámbito de la Bioinformática y la Bioestadística.

Amunt

Català:

No són necessaris coneixements previs més enllà dels generals del curs, com la comprensió lectora en anglès per entendre els materials del curs i coneixements bàsics d'àlgebra lineal.

Castellano:

No son necesarios conocimientos previos más que los generales del curso, comprensión lectora en inglés para entender materiales y enlaces web y unos conocimientos básicos de álgebra lineal. 

Amunt

Català:

Aquesta assignatura pretén donar a conèixer el programa R a nivell bàsic i intermedi. Com a resultat d'aquest aprenentatge, s'espera que l'estudiant adquireixi les següents capacitats:

  •  Aprendre a usar R com a programari estadístic avançat i lliure
  •  Aprendre a usar les principals interfícies i IDEs de R (i.g., R Commander, R Studio, etc.)
  •  Aprendre a usar R com a llenguatge de programació
  •  Aprendre a usar els principals paquets (llibreries) de R associats als continguts de bioinformàtica i bioestadística


En el context general del Màster en Bioinformática i Bioestadística, es concreta a continuació les diferents competències de l'assignatura:

Competències bàsiques i generals:

  • Totes les competències bàsiques del màster.
  • Totes les competències generals del màster.

Competències transversals:

  • CT1- Capacitat d'iniciativa, d'automotivació  i de treballar de forma independent.
  • CT3- Capacitat per proposar solucions innovadores i prendre de decisions.
  • CT5- Capacitat per a la comprensió, l'anàlisi i la síntesi.

 
Competències específiques:

  • CE2- Adquirir les habilitats tècniques apropiades per la bioinformàtica, com a programació, creació i gestió de bases de dades, creació de pàgines web, anàlisis i disseny d'algorismes, i conèixer el seu ús i aplicació en la bioinformàtica.
  • CE3- Conèixer els principis bàsics d'inferència estadística i entendre el seu paper fonamental en la bioestadística.
  • CE4- Conèixer els principals mètodes de regressió adequats a diferents tipus de dades, saber ajustar els models apropiats i saber com avaluar la  bondat de l'ajust.
  • CE6- Adquirir la capacitat de manejar, gestionar, interpretar i analitzar grans volums de dades usant programari estadístic adequat com el llenguatge estadístic R.
  • CE8- Conèixer les eines de programari estadístic adequades per als diferents problemes de modelització i anàlisi de dades.
  • CE13- Conèixer aspectes ètics i legals relacionats amb el desenvolupament de productes i l'àmbit empresarial de la bioinformàtica i la bioestadística.

Castellano:

OBJETIVOS Y COMPETENCIAS

Esta asignatura pretende dar a conocer el programa R a nivel básico e intermedio. Como resultado de este aprendizaje, se espera que el estudiante adquiera las siguientes capacidades:

  •  Aprender a usar R como software estadístico avanzado y libre.
  •  Aprender a usar las principales interfaces e IDEs de R (i.g., R Commander, R Studio, etc.)
  • Aprender a usar R como lenguaje de programación.
  • Aprender a usar los principales paquetes (librerías) de R asociados a los contenidos de bioinformática y bioestadística

En el contexto general del Máster en Bioinformática y Bioestadística, se concreta a continuación las diferentes competencias de la asignatura:

Competencias básicas y generales:

Todas las competencias básicas y generales del máster. 

Competencias transversales:

  • CT1- Capacidad de iniciativa, de automotivación y de trabajar de forma independiente.
  • CT3- Capacidad para proponer soluciones innovadoras y tomar decisiones.
  • CT5- Capacidad para la comprensión, el análisis y la síntesis.

Competencias específicas:

  • CE2- Adquirir las habilidades técnicas apropiadas por la bioinformática, como programación, creación y gestión de bases de datos, creación de páginas web, análisis y diseño de algoritmos, y conocer su uso y aplicación en la bioinformática.
  • CE3- Conocer los principios básicos de inferencia estadística y entender su papel fundamental en la bioestadística.
  • CE4- Conocer los principales métodos de regresión adecuados a distintos tipos de datos, saber ajustar los modelos apropiados y saber cómo evaluar la bondad del ajuste.
  • CE6- Adquirir la capacidad de manejar, gestionar, interpretar y analizar grandes volúmenes de datos usando software estadístico adecuado como el lenguaje estadístico R.
  • CE8- Conocer las herramientas de software estadístico adecuadas para los distintos problemas de modelización y análisis de datos.
  • CE13- Conocer aspectos éticos y legales relacionados con el desarrollo de productos y el ámbito empresarial de la bioinformática y la bioestadística.

Amunt

Català:

De forma genèrica, els continguts que es treballen en aquest curs són els següents:

  • Instal·lació i configuració de R, R Studio, i R Commander
  • Ús de R com a eina per a l'anàlisi de dades en bioinformàtica i bioestadística
  • Ús de R com a llenguatge de programació en bioinformàtica i bioestadística
  • Principals paquets (llibreries) de R en bioinformàtica i bioestadística

Contingut detallats del curs:

1. Presentació de l'assignatura. Programa R. Instal·lació.

1.1. Descàrrega, instal¿lació i entorn de treball de R.

2. El Llenguatge R

2.1. Conceptes bàsics en R.
2.2. Tipus de variables en R.
2.3. Funcions en R.
2.4 Vectors lògics i operadors relacionals
2.5. Data input & output.
2.6. Exercicis del tema

3. Gràfics bàsics amb R

3.1 Tipus de gràfics.
3.2 Funcions dels gràfics.
3.3 Exercicis de repàs de gràfic

4. Programació amb R

4.1. Maneig de fitxers i bases de dades.
4.2 Programació Eficient
4.3 Les funcions amb R
4.4 Consells per a la programació.
4.5 Exercicis de Programació

5. Recerca reproduïble

5.1 Estructurar i organitzar les dades en recerca
5.2 Markdown and R Markdown
5.3 Knitr

6. Simulació amb R.

6.1 Simulació de Montecarlo
6.2 Generació de nombres aleatoris
6.3 Mostra i simulació de distribucions típiques.
6.5 Exercicis de simulació

7. Gràfics per a publicacions.

7.1 Canvi de "look" dels gràfics.
7.2 Símbols Matemàtics en els gràfics
7.3 Lattice()
7.4 Panell de Gràfics

CONTENIDOS:

De forma genérica, los contenidos que se trabajan en este curso son los siguientes:

  • Instalación y configuración de R, R Studio, y R Commander
  • Uso de R como herramienta para el análisis de datos en bioinformática y bioestadística
  • Uso de R como lenguaje de programación en bioinformática y bioestadística Principales paquetes (librerías) de R en bioinformática y bioestadísti

Contenido detallados del curso:

1. Presentación de la asignatura. Programa R. Instal·lación.

1.1. Descarga, instalación y entorno de trabajo en R.

2. El Llenguatge R

2.1. Conceptos básicos en R.
2.2. Tipos de variables en R.
2.3. Funciones en R.
2.4 Vectores lógicos y operadores relacionales
2.5. Data input & output.
2.6. Ejercicios del tema.

3. Gráficos básicos con R

3.1 Tipos de gráficos.
3.2 Funciones de los gráficos.
3.3 Ejercicios de repaso de gráficos.

4. Programación con R

4.1. Manejo de ficheros y bases de datos.
4.2 Programación Eficiente.
4.3 Las funciones de R
4.4 Consejos para una programación correcta.
4.5 Ejercicios de programación.


5. Recerca reproduïble

5.1 Estructurar y organizar los datos en investigación.
5.2 Markdown and R Markdown.
5.3 Knitr y otras aplicaciones. 

6. Simulación con R.

6.1 Simulación de Montecarlo.
6.2 Generación de numeros aleatorios.
6.3 Muestra y simulación de distribuciones típicas.
6.5 Ejercicios de simulación.

7. Gràficos para publicaciones.

7.1 Cambio de aspecto de los gráficos.
7.2 Símbolos Matemáticos en los gráficos.
7.3 Lattice()
7.4 Panel de Gráficos.

Amunt

0. Uso de los laboratorios en software para el análisis de datos PDF
1. Introducción al lenguaje R PDF
3. Programación en R PDF
5. Modelos de análisis de datos y machine learning con R PDF
4. Simulación con R y R Commander PDF
6. Aplicaciones con R y RStudio PDF
2. Estadística descriptiva y gráficos con R y R Commander PDF

Amunt

Materiales básicos:

A First Course in Statistical Programming with R (e-book).


Materiales complementarios:

Crawley, M (2009). The R Book.

Mathur (2010). Statistical Bioinformatics with R.

Logan, M. (2010): Biostatistical Design and Analysis Using R: A Practical Guide.

Amunt

El procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat dels exercicis realitzats.

La manca d'autenticitat en l'autoria o d'originalitat de les proves d'avaluació; la còpia o el plagi; l'intent fraudulent d'obtenir un resultat acadèmic millor; la col·laboració, l'encobriment o l'afavoriment de la còpia, o la utilització de material o dispositius no autoritzats durant l'avaluació, entre d'altres, són conductes irregulars que poden tenir conseqüències acadèmiques i disciplinàries greus.

D'una banda, si es detecta alguna d'aquestes conductes irregulars, pot comportar el suspens (D/0) en les activitats avaluables que es defineixin en el pla docent –incloses les proves finals– o en la qualificació final de l'assignatura, sigui perquè s'han utilitzat materials o dispositius no autoritzats durant les proves, com ara xarxes socials o cercadors d'informació a internet, perquè s'han copiat fragments de text d'una font externa (internet, apunts, llibres, articles, treballs o proves d'altres estudiants, etc.) sense la citació corresponent, o perquè s'ha practicat qualsevol altra conducta irregular.

De l'altra, i d'acord amb les normatives acadèmiques, les conductes irregulars en l'avaluació, a més de comportar el suspens de l'assignatura, poden donar lloc a la incoació d'un procediment disciplinari i a l'aplicació, si escau, de la sanció que correspongui.

Amunt

Aquesta assignatura només es pot superar a partir de l'avaluació contínua (AC). La nota final d'avaluació contínua esdevé la nota final de l'assignatura. La fórmula d'acreditació de l'assignatura és la següent: AC.

 

Amunt