Programari per a l'anàlisi de dades Codi:  M0.153    :  5
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Camps professionals en què es projecta   Coneixements previs   Objectius i competències   Continguts   Consulta dels recursos d'aprenentatge de què disposa l'assignatura   Recursos d'aprenentatge i eines de suport   Informacions sobre l'avaluació a la UOC   Consulta del model d'avaluació  
Aquest és el pla docent de l'assignatura per al segon semestre del curs 2023-2024. Podeu consultar si l'assignatura s'ofereix aquest semestre a l'espai del campus Més UOC / La universitat / Plans d'estudis). Un cop comenci la docència, heu de consultar-lo a l'aula. El pla docent pot estar subjecte a canvis.
 L'assignatura de Programari per a l'Anàlisi de Dades se centra en l'aprenentatge i maneig del paquet estadístic R.

- Paquet estadístic R: El paquet estadístic R és un dels més flexibles i potents per al tractament i anàlisi de les dades, des dels més elementals als més avançats. Aquest programari està desenvolupat i mantingut per la comunitat científica internacional. És, a més, un programa gratuït i es descarrega de forma fàcil i segura.

Amunt

L'assignatura introdueix a l'alumne al maneig i ús a nivell principiant/mitjà del paquet R.

Per a això s'introdueixen tasques senzilles per al maneig de dades estadístiques, la simulació de variables aleatòries en els casos univariables i multivariants, el maneig de bases de dades, la representació gràfica i la programació de tasques estadístiques amb el llenguatge de programació inclòs en R. Aquesta assignatura està inclosa en el pla d'estudis del Màster en Bioinformàtica i Bioestadística, per la qual cosa els exemples i exercicis s'emmarcaran en el camp de les ciències de la vida i la salut.

Amunt

 Al final de l'assignatura, l'alumne serà capaç de realitzar operacions de maneig de dades univariables i multivariants, incloent emmagatzematge, recuperació, creació d'estructures de dades i representació gràfica dels mateixos. A més, estarà capacitat per simular variables aleatòries, programar diferents rutines estadístiques i repassar algunes operacions algebraiques. Tot això servirà per programar i analitzar dades en qualsevol àmbit, en particular l'àmbit de la Bioinformàtica i la Bioestadística.

Amunt

No són necessaris coneixements previs més enllà dels generals del curs, com la comprensió lectora en anglès per entendre els materials del curs i coneixements bàsics d'àlgebra lineal

Amunt

Aquesta assignatura pretén donar a conèixer el programa R a nivell bàsic i intermedi. Com a resultat d'aquest aprenentatge, s'espera que l'estudiant adquireixi les següents capacitats:

  •  Aprendre a usar R com a programari estadístic avançat i lliure
  •  Aprendre a usar les principals interfícies i IDEs de R (i.g., R Commander, R Studio, etc.)
  •  Aprendre a usar R com a llenguatge de programació
  •  Aprendre a usar els principals paquets (llibreries) de R associats als continguts de bioinformàtica i bioestadística

En el context general del Màster en Bioinformática i Bioestadística, es concreta a continuació les diferents competències de l'assignatura:

Competències bàsiques i generals:
  • Totes les competències bàsiques del màster.
  • Totes les competències generals del màster.
Competències transversals:

  • CT1- Capacitat d'iniciativa, d'automotivació  i de treballar de forma independent.
  • CT3- Capacitat per proposar solucions innovadores i prendre de decisions.
  • CT5- Capacitat per a la comprensió, l'anàlisi i la síntesi.
 
Competències específiques:

  • CE2- Adquirir les habilitats tècniques apropiades per la bioinformàtica, com a programació, creació i gestió de bases de dades, creació de pàgines web, anàlisis i disseny d'algorismes, i conèixer el seu ús i aplicació en la bioinformàtica.
  •  CE3- Conèixer els principis bàsics d'inferència estadística i entendre el seu paper fonamental en la bioestadística.
  •  CE4- Conèixer els principals mètodes de regressió adequats a diferents tipus de dades, saber ajustar els models apropiats i saber com avaluar la bondat de l'ajust.
  • CE6- Adquirir la capacitat de manejar, gestionar, interpretar i analitzar grans volums de dades usant programari estadístic adequat com el llenguatge estadístic R.
  • CE8- Conèixer les eines de programari estadístic adequades per als diferents problemes de modelització i anàlisi de dades.
  •  CE13- Conèixer aspectes ètics i legals relacionats amb el desenvolupament de productes i l'àmbit empresarial de la bioinformàtica i la bioestadística.

Amunt

De forma genèrica, els continguts que es treballen en aquest curs són els següents:

  • Instal¿lació i configuració de R, R Studio, i R Commander
  • Ús de R com a eina per a l'anàlisi de dades en bioinformàtica i bioestadística
  • Ús de R com a llenguatge de programació en bioinformàtica i bioestadística
  • Principals paquets (llibreries) de R en bioinformàtica i bioestadística
Contingut detallats del curs:

1. Presentació de l'assignatura. Programa R. Instal¿lació.
1.1. Descàrrega, instal¿lació i entorn de treball de R.

2. El Llenguatge R

2.1. Conceptes bàsics en R.
2.2. Tipus de variables en R.
2.3. Funcions en R.
2.4 Vectors lògics i operadors relacionals
2.5. Data input & output.
2.6. Exercicis del tema

3. Gràfics bàsics amb R.
3.1 Tipus de gràfics.
3.2 Funcions dels gràfics.
3.3 Exercicis de repàs de gràfic

4. Programació amb R

4.1. Maneig de fitxers i bases de dades.
4.2 Programació Eficient
4.3 Les funcions amb R
4.4 Consells per a la programació.
4.5 Exercicis de Programació

5. Recerca reproduïble

5.1 Estructurar i organitzar les dades en recerca
5.2 Markdown and R Markdown
5.3 Knitr

6. Simulació amb R.

6.1 Simulació de Montecarlo
6.2 Generació de nombres aleatoris
6.3 Mostra i simulació de distribucions típiques.
6.5 Exercicis de simulació

7. Gràfics per a publicacions.

7.1 Canvi de "look" dels gràfics J.
7.2 Símbols Matemàtics en els gràfics
7.3 Lattice()
7.4 Panell de Gràfics

Amunt

Introducción al lenguaje R, Rstudio y R Markdown PDF
Introducció al llenguatge R, RStudio y R Markdown PDF
Estadística descriptiva y gráficos con R PDF
Estadística descriptiva i gràfics amb R PDF
Fundamentos de programación y acceso a base de datos en R PDF
Fonaments de programació i accés a base de dades en R PDF
Probabilidad y simulación con R PDF
Probabilitat i simulació amb R PDF
Introducción al machine learning con R PDF
Introducció al machine learning amb R PDF
Paquetes de R para la bioinformática PDF
Paquets de R per a la bioinformàtica PDF

Amunt

Materiales básicos:

A First Course in Statistical Programming with R (e-book).


Materiales complementarios:

Crawley, M (2009). The R Book.

Mathur (2010). Statistical Bioinformatics with R.

Logan, M. (2010): Biostatistical Design and Analysis Using R: A Practical Guide.

Amunt

La Normativa acadèmica de la UOC disposa que el procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat dels exercicis fets.

La manca d'originalitat en l'autoria o el mal ús de les condicions en què es fa l'avaluació de l'assignatura és una infracció que pot tenir conseqüències acadèmiques greus.

Es qualificarà l'estudiant amb un suspens (D/0) si es detecta manca d'originalitat en l'autoria d'alguna activitat avaluable (pràctica, prova d'avaluació contínua (PAC) o final (PAF), o la que es defineixi al pla docent), sigui perquè ha utilitzat material o dispositius no autoritzats, sigui perquè ha copiat textualment d'internet, o ha copiat d'apunts, de materials, de manuals o d'articles (sense la citació corresponent), d'altres estudiants, o per qualsevol altra conducta irregular.

La qualificació de suspens (D/0) en les qualificacions finals d'avaluació contínua pot comportar l'obligació de fer l'examen presencial per a superar l'assignatura (si hi ha examen i si superar-lo és suficient per a superar l'assignatura segons indiqui el pla docent).

Quan aquesta mala conducta es produeixi durant la realització de les proves d'avaluació finals presencials, l'estudiant pot ser expulsat de l'aula, i l'examinador farà constar tots els elements i la informació relatius al cas.

D'altra banda, aquesta conducta pot donar lloc a la incoació d'un procediment disciplinari i l'aplicació, si escau, de la sanció que correspongui.

La UOC habilitarà els mecanismes que consideri oportuns per a vetllar per la qualitat de les seves titulacions i garantir l'excel·lència i la qualitat del seu model educatiu.

Amunt

L'assignatura només es pot aprovar amb el seguiment i la superació de l'avaluació contínua (AC). La qualificació final de l'assignatura és la nota obtinguda a l'AC.

 

Amunt