Programari per a l'anàlisi de dades Codi:  M0.153    :  5
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Camps professionals en què es projecta   Coneixements previs   Informació prèvia a la matrícula   Objectius i competències   Continguts   Consulta dels recursos d'aprenentatge de la UOC per a l'assignatura   Informació addicional sobre els recursos d'aprenentatge i eines de suport   Informacions sobre l'avaluació a la UOC   Consulta del model d'avaluació  
Aquest és el pla docent de l'assignatura per al primer semestre del curs 2024-2025. Podeu consultar si l'assignatura s'ofereix aquest semestre a l'espai del campus Més UOC / La universitat / Plans d'estudis). Un cop comenci la docència, heu de consultar-lo a l'aula. El pla docent pot estar subjecte a canvis.

L'assignatura de Programari per a l'Anàlisi de Dades se centra en l'aprenentatge i el maneig del paquet estadístic R i eines relacionades.

- Paquet estadístic R: El paquet estadístic R és un dels més flexibles i potents per al tractament i anàlisi de les dades, des dels més elementals als més avançats. Aquest programari està desenvolupat i mantingut per la comunitat científica internacional. És, a més, un programa gratuït, lliure i es descarrega de manera fàcil i segura.

- R-Commander: R-Comander és una Interfície Gràfica d'Usuari (GUI) del programa R.

- RStudio: R-Studio és l'entorn de desenvolupament (IDE) de R.

- RMarkdown: Extensió de Markdown per a R, funcionalitat que permet convertir (de manera ràpida i senzilla) text pla a un format de màxima llegibilitat i facilitat de publicació.

Amunt

L'assignatura introdueix a l'alumne al maneig i ús a nivell principiant/mitjà del paquet R.

Per a això s'introdueixen tasques senzilles per al maneig de dades estadístiques, la simulació de variables aleatòries en els casos univariables i multivariants, el maneig de bases de dades, la representació gràfica i la programació de tasques estadístiques amb el llenguatge de programació inclòs en R.

Aquesta assignatura està inclosa en el pla d'estudis del Màster en Bioinformàtica i Bioestadística, per la qual cosa els exemples i exercicis s'emmarcaran en el camp de les ciències de la vida i la salut.

Amunt

Al final de l'assignatura, l'alumne serà capaç de realitzar operacions de maneig de dades univariables i multivariants, incloent emmagatzematge, recuperació, creació d'estructures de dades i representació gràfica dels mateixos. 

A més, estarà capacitat per simular variables aleatòries, programar diferents rutines estadístiques i repassar algunes operacions algebraiques. Tot això servirà per programar i analitzar dades en qualsevol àmbit, en particular l'àmbit de la Bioinformàtica i la Bioestadística.

Amunt

No són necessaris coneixements previs més enllà dels generals del curs, com la comprensió lectora en anglès per entendre els materials del curs i coneixements bàsics d'àlgebra lineal.

Cal tenir una base d'estadística descriptiva i inferència i, també, un bon maneig de les eines informàtiques i coneixement bàsic d'algun llenguatge de programació.

Amunt

  • Restriccions d'accés: No hi ha restriccions d'accés.
  • Recomanacions d'accés: Idealment, aquesta assignatura s'hauria de cursar el primer semestre del Màster.

Amunt

Aquesta assignatura pretén donar a conèixer el programa R a nivell bàsic i intermedi. Com a resultat d'aquest aprenentatge, s'espera que l'estudiant adquireixi les següents capacitats:
  1.  Aprendre a usar R com a programari estadístic avançat i lliure
  2.  Aprendre a usar les principals interfícies, IDEs i einies de R (i.g., R Commander, R Studio, RMarkdown, etc.)
  3.  Aprendre a usar R com a llenguatge de programació
  4.  Aprendre a usar els principals paquets (llibreries) de R associats als continguts de bioinformàtica i bioestadística

En el context general del Màster en Bioinformática i Bioestadística, es concreta a continuació les diferents competències de l'assignatura:

Competències bàsiques i generals:

  • Totes les competències bàsiques del màster.
  • Totes les competències generals del màster.

Competències transversals:

  • CT1- Capacitat d'iniciativa, d'automotivació  i de treballar de forma independent.
  • CT3- Capacitat per proposar solucions innovadores i prendre de decisions.
  • CT5- Capacitat per a la comprensió, l'anàlisi i la síntesi.

 
Competències específiques:

  • CE2- Adquirir les habilitats tècniques apropiades per la bioinformàtica, com a programació, creació i gestió de bases de dades, creació de pàgines web, anàlisis i disseny d'algorismes, i conèixer el seu ús i aplicació en la bioinformàtica.
  • CE3- Conèixer els principis bàsics d'inferència estadística i entendre el seu paper fonamental en la bioestadística.
  • CE4- Conèixer els principals mètodes de regressió adequats a diferents tipus de dades, saber ajustar els models apropiats i saber com avaluar la  bondat de l'ajust.
  • CE6- Adquirir la capacitat de manejar, gestionar, interpretar i analitzar grans volums de dades usant programari estadístic adequat com el llenguatge estadístic R.
  • CE8- Conèixer les eines de programari estadístic adequades per als diferents problemes de modelització i anàlisi de dades.
  • CE13- Conèixer aspectes ètics i legals relacionats amb el desenvolupament de productes i l'àmbit empresarial de la bioinformàtica i la bioestadística.

Amunt

De manera genèrica, els continguts que treballem són els següents:
  • Instal·lació i configuració de R, RStudio i R Markdown.
  • Ús de R com a eina per a l'anàlisi de dades en bioinformàtica i bioestadística.
  • Ús de R com a llenguatge de programació en bioinformàtica i bioestadística.
  • Principals paquets (llibreries) de R en bioinformàtica i bioestadística.
Continguts detallats del curs:

1. Introducció al llenguatge de programació R, Rstudio i R Markdown.

1.1 Instal·lació de R i Rstudio

1.2 Interfície de R i Rstudio

1.3 Introducció a R Markdown

1.4 Gestió de paquets a R

1.5 Importació de dades a R i Rstudio

1.6 Exportació de dades a R

1.7 Estructura de dades a R

1.8 Conjunts de dades

1.9 Visualització de les dades a R. Gràfiques base

2. Estadística descriptiva i gràfics amb R.

2.1 Resum de dades i variable a R

2.2 Etiquetar i recodificar a R

2.3 Taules de freqüències amb R

2.4 Gràfics bàsics en R

2.5 Paquet ggplot2 per a la creació de gràfics

2.6 Guardar i exportar gràfics a R

2.7 Regressió lineal amb R

2.8 ANOVA

3. Fonaments de programació i accés a base de dades a R.

3.1 Elements bàsics de R: operadors, variables i tipus de dades

3.2 Estructures de dades

3.3 Instruccions bàsiques del llenguatge R

3.4 Funcions en R

3.5 Accés a bases de dades a R

4. Probabilitat i simulació amb R.

4.1 Probabilitat amb R

4.2 Distribucions de probabilitat

4.3 Tipus de distribucions usades en probabilitat

4.4 Simulació amb R

4.5 Mostratge

5. Introducció al machine learning amb R

5.1 Conceptes bàsics de laprenentatge automatitzat (machine learning)

5.2 Aprenentatge supervisat amb R

5.3 Aprenentatge no supervisat amb R

5.4 Aprenentatge profund (deep learning) amb R

5.5 Anàlisi de variància (ANOVA)

6. Paquets de R per a la bioinformàtica

6.1 Ecosistema de R: Entorns reproduïbles i visualització de dades amb Shiny

6.2 Bioconductor, un projecte de codi obert per a bioinformàtica

6.3 Aplicació a l'àmbit biosanitari d'alguns paquets rellevants de R

Amunt

Introducción al lenguaje R, Rstudio y R Markdown PDF
Introducció al llenguatge R, RStudio y R Markdown PDF
Estadística descriptiva y gráficos con R PDF
Estadística descriptiva i gràfics amb R PDF
Fundamentos de programación y acceso a base de datos en R PDF
Fonaments de programació i accés a base de dades en R PDF
Probabilidad y simulación con R PDF
Probabilitat i simulació amb R PDF
Introducción al machine learning con R PDF
Introducció al machine learning amb R PDF
Paquetes de R para la bioinformática PDF
Paquets de R per a la bioinformàtica PDF

Amunt

Materials bàsics:

A First Course in Statistical Programming with R (e-book).


Materials complementaris:

Crawley, M (2009). The R Book.

Mathur (2010). Statistical Bioinformatics with R.

Logan, M. (2010): Biostatistical Design and Analysis Using R: A Practical Guide.

Amunt

A la UOC, l'avaluació generalment és virtual. S'estructura entorn de l'avaluació contínua, que inclou diferents activitats o reptes; l'avaluació final, que es porta a terme mitjançant proves o exàmens, i el treball final de la titulació.

Les activitats o proves d'avaluació poden ser escrites i/o audiovisuals, amb preguntes aleatòries, proves orals síncrones o asíncrones, etc., d'acord amb el que decideixi cada equip docent. Els treballs finals representen el tancament d'un procés formatiu que implica la realització d'un treball original i tutoritzat que té com a objectiu demostrar l'adquisició competencial feta al llarg del programa.

Per verificar la identitat de l'estudiant i l'autoria de les proves d'avaluació, la UOC es reserva la potestat d'aplicar diferents sistemes de reconeixement de la identitat i de detecció del plagi. Amb aquest objectiu, la UOC pot dur a terme enregistrament audiovisual o fer servir mètodes o tècniques de supervisió durant l'execució de qualsevol activitat acadèmica.

Així mateix, la UOC pot exigir a l'estudiant l'ús de dispositius electrònics (micròfons, càmeres o altres eines) o programari específic durant l'avaluació. És responsabilitat de l'estudiant assegurar que aquests dispositius funcionen correctament.

El procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat de les activitats acadèmiques. Al web sobre integritat acadèmica i plagi de la UOC hi ha més informació respecte d'aquesta qüestió.

La manca d'autenticitat en l'autoria o d'originalitat de les proves d'avaluació; la còpia o el plagi; la suplantació d'identitat; l'acceptació o l'obtenció de qualsevol activitat acadèmica a canvi d'una contraprestació o no; la col·laboració, l'encobriment o l'afavoriment de la còpia, o l'ús de material, programari o dispositius no autoritzats en el pla docent o l'enunciat de l'activitat acadèmica, inclosa la intel·ligència artificial i la traducció automàtica, entre altres, són conductes irregulars en l'avaluació que poden tenir conseqüències acadèmiques i disciplinàries greus.

Aquestes conductes irregulars poden comportar el suspens (D/0) en les activitats avaluables que es defineixin en el pla docent -incloses les proves finals- o en la qualificació final de l'assignatura, sigui perquè s'han utilitzat materials, programari o dispositius no autoritzats durant les proves (com l'ús d'intel·ligència artificial no permesa, xarxes socials o cercadors d'informació a internet), perquè s'han copiat fragments de text d'una font externa (internet, apunts, llibres, articles, treballs o proves d'altres estudiants, etc.) sense la citació corresponent, per la compravenda d'activitats acadèmiques, o perquè s'ha dut a terme qualsevol altra conducta irregular.

Així mateix, i d'acord amb la normativa acadèmica, les conductes irregulars en l'avaluació també poden donar lloc a la incoació d'un procediment disciplinari i a l'aplicació, si escau, de la sanció que correspongui, de conformitat amb el que estableix la normativa de convivència de la UOC.

En el marc del procés d'avaluació, la UOC es reserva la potestat de:

  • Sol·licitar a l'estudiant que acrediti la seva identitat segons el que estableix la normativa acadèmica.
  • Sol·licitar a l'estudiant que acrediti l'autoria del seu treball al llarg de tot el procés d'avaluació, tant en l'avaluació contínua com en l'avaluació final, per mitjà d'una entrevista oral síncrona, que pot ser objecte d'enregistrament audiovisual, o pels mitjans que estableixi la Universitat. Aquests mitjans tenen l'objectiu de verificar els coneixements i les competències que garanteixin la identitat de l'estudiant. Si no és possible garantir que l'estudiant és l'autor de la prova, aquesta pot ser qualificada amb una D, en el cas de l'avaluació contínua, o amb un suspens, en el cas de l'avaluació final.

Intel·ligència artificial en el marc de l'avaluació

La UOC reconeix el valor i el potencial de la intel·ligència artificial (IA) en l'àmbit educatiu, alhora que posa de manifest els riscos que comporta si no s'utilitza de manera ètica, crítica i responsable. En aquest sentit, en cada activitat d'avaluació s'informarà l'estudiantat sobre les eines i els recursos d'IA que es poden utilitzar i en quines condicions. Per la seva banda, l'estudiantat es compromet a seguir les indicacions de la UOC a l'hora de dur a terme les activitats d'avaluació i de citar les eines utilitzades i, concretament, a identificar els textos o les imatges generats per sistemes d'IA, els quals no podrà presentar com si fossin propis.

Amb relació a fer servir o no la IA per resoldre una activitat, l'enunciat de les activitats d'avaluació indica les limitacions en l'ús d'aquestes eines. Cal tenir en compte que fer-les servir de manera inadequada, com ara en activitats en què no estan permeses o no citar-les en les activitats en què sí que ho estan, es pot considerar una conducta irregular en l'avaluació. En cas de dubte, es recomana que, abans de lliurar l'activitat, es faci arribar una consulta al professorat col·laborador de l'aula.

Amunt

L'assignatura només es pot aprovar amb el seguiment i la superació de l'avaluació contínua (AC). La qualificació final de l'assignatura és la nota obtinguda a l'AC.

 

Amunt