Inferència estadística Codi:  M0.155    :  5
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Camps professionals en què es projecta   Coneixements previs   Objectius i competències   Continguts   Consulta dels recursos d'aprenentatge de què disposa l'assignatura   Recursos d'aprenentatge i eines de suport   Informacions sobre l'avaluació a la UOC   Consulta del model d'avaluació  
Aquest és el pla docent de l'assignatura per al segon semestre del curs 2023-2024. Podeu consultar si l'assignatura s'ofereix aquest semestre a l'espai del campus Més UOC / La universitat / Plans d'estudis). Un cop comenci la docència, heu de consultar-lo a l'aula. El pla docent pot estar subjecte a canvis.

 La bioestadística tracta de l'aplicació de l'estadística a problemes de ciències de la vida (denominada habitualment biometria) o de la salut (comunament descrita en aquest cas com bioestadística). Com totes les ciències aplicades, consta d'una o més disciplines bàsiques, aquí l'estadística, l'aplicació de la qual se centra o especialitza en un determinat àmbit, aquí la biologia, la bioinformàtica o la medicina.

Els fonaments de bioestadística que es presenten en aquesta assignatura discorren al llarg de les dues idees que s'acaben d'esmentar. D'una banda es busca establir els conceptes i mètodes bàsics sobre probabilitat i estadística que tot practicant d'aquesta disciplina ha de conèixer. Al mateix temps, atès que a aquesta la segueixen altres assignatures, cal que serveixi per fonamentar-les. En resum,  una part de l'assignatura deu servir per presentar idees bàsiques i l'altra servir de base sobre la qual construir desenvolupaments posteriors, en aquest programa o uns altres que li puguin seguir.

Per a això l'assignatura s'organitzarà en tres blocs que es descriuen amb detall més endavant: Models probabilístics, conceptes d'inferència estadística i aplicacions.

Per acabar aquesta descripció general val la pena dir dues coses sobre que "no és" la bioestadística. La bioestadística no és estadística "diluïda" perquè puguin entendre-la professionals sense formació matemàtica. És estadística de qualsevol tipus o nivell que s'aplica a problemes de ciències de la vida. La bioestadística no és tampoc epidemiologia, psicometria o genètica estadística: Aquestes disciplines es recolzen, com la bioestadística, en l'estadística, alhora que s'apliquen a ciències de la vida, però la seva trajectòria ha estat ja prou deixa anar com perquè pugui considerar-les-hi independents de la qual aquí ens ocupa.

Amunt

 Aquesta assignatura es troba al principi del pla d'estudis per dos motius: D'una banda, perquè presenta els conceptes bàsics que tot usuari de la (bio)estadística deu conèixer, servint de pont entre un eventual formació prèvia i aquest màster. Per l'altre, perquè estableix les bases sobre les quals construir les altres assignatures, sent per tant aquesta l'única posició raonable: abans de les altres matèries.

Amunt

La bioestadística ha tingut sempre una gran aplicació en les ciències de la vida. La hi troba en multitud d'àmbits, que van des de la recerca agrícola, contribuint a estudis de millora vegetal (transgènica o no), fins a la "Salut pública" -per exemple ajudant a dissenyar enquestes de qualitat de vida. Passant naturalment per la recerca mèdica de petita escala (anàlisi de dades en estudis senzills) o de grans dimensions (per exemple assajos clínics multicèntrics, per exemple per a la vacuna de la malària en múltiples països africans).
Les competències i habilitats concretes que d'aquesta assignatura es deriven haurien de preparar per a la realització d'anàlisis estadístiques bàsiques, per la qual cosa es projecta en qualsevol camp professional en què deguin realitzar-se tractaments de dades, des del control de qualitat en el laboratori, les ciències ambientals o la recerca biomèdica bàsica.

Exemples de perfils professionals que fan un ús important dels conceptes i tècniques desenvolupats en aquesta assignatura són els següents:

  • Investigadors de qualsevol àmbit de ciències de la vida que hagin de dissenyar experiments, organitzar la seva informació o analitzar les dades obtingudes.
  • Personal de suport en hospitals, laboratoris o centres de recerca que pugui necessitar tractar la informació generada per l'activitat pròpia del centre.
  • Analistes de dades, bioestadística@s o «data scientists», terme de recent aparició que es refereix a professionals amb coneixement d'anàlisi de dades però també d'informàtica i gestió de dades a la web entre altres habilitats.
  • Bioinformàtic. No es tracta d'una confusió del pla docent sinó generalitzada: molts científics creuen que necessiten un bioinformàtic però les tasques pel qual ho pensen és el de bioestadístic.

Amunt

Aquesta assignatura pot afrontar-se amb dos tipus de coneixements previs:

  • Seria ideal certa formació matemàtica -un curs d'àlgebra i càlcul i algun d'estadística bàsica- per poder avançar ràpidament i fonamentar els conceptes que potser s'hagin adquirit des d'una perspectiva pràctica.
  • En absència d'aquesta base, els requeriments seran una mica més amplis, atès que caldrà treballar alhora els aspectes tècnics, conceptuals i l'aplicació.
  • Coneixements bàsics de R. En cas de no tenir-los aquestos  aniran adquirint-se a l'hora en la asignatura software para l'anàlisi de dades


Ara bé, és un fet,  que la formació estadística i matemàtica és d'allò més heterogènia pel que, en comptes d'assumir que es coneix tot el que s'hauria de conèixer, es disposaran d'apuntadors "" adequats a material de reforç, amb la finalitat de disposar d'informacions bàsiques sobre les tècniques que s'utilitzessin en l'assignatura.

Amunt

Aquesta assignatura pretén establir les bases probabilístiques i estadístiques per a l'estudi de temes més avançats alhora que presentar les eines bàsiques de tota anàlisi de dades.


Les capacitats a adquirir seran:

  • Coneixement dels fonaments de probabilitat adequats per modelitzar situacions d'interès en problemes biològics alhora que per fonamentar els mètodes estadístics presentats en la segona part de l'assignatura i resta del  programa
  • Coneixement dels mètodes estadístics bàsics per a l'anàlisi de dades quantitatives o qualitatius en un context paramètric o no paramètric.
  • Coneixement a nivell conceptual i/o operatiu -segons el cas- de conceptes i tècniques més avançats amb la finalitat de tenir, alhora que unes eines bàsiques, una perspectiva àmplia de la  bioestadística.

Amunt

Els continguts s'organitzen per unitats que es presenten a l'alumne amb una durada de 2 setmanes per a la seva lectura i estudi. Intercalades entre les setmanes de dues unitats es proposen debats no avaluables per discutir sobre qüestions teòriques , exercicis i pràctiques per part de l'alumnat. En el següent temari estan els principals punts que es van a tractar, que seran detallats en cadascuna de les unitats.

Unitat I. Probabilitat i variables aleatòries

1.1. Introducció: Models probabilístics en Biologia.

1.2. Probabilitat i regles de càlcul de probabilitats.

1.3 Independència i Probabilitat condicionada. Llei de Probabilitat Total. Teorema de Bayes

1.4. La modelització de la variabilitat biològica: Variables aleatòries

1.5. Característiques de les variables aleatòries: Esperanza i variància

1.6. Distribucions de probabilitat univariables.

 

Unitat II: Probabilitat i variables aleatòries (II)

2.1. Variables aleatòries multidimensionales.

2.2 Distribucions conjuntes, marginals i condicionals,.

2.3 Valors esperats, covariància i correlació.

2.4 Distribucions multivariantes: Multinomial i Normal bivariante.

2.5 Lleis dels grans nombres i Teorema Central del Limit

Unitat III: Introducció a la  inferència estadística: mostreig i estimació

3.1. Els problemes de la inferència estadística.

3.2. Mostreig i distribucions en el mostreig.

3.3. La versemblança i el seu paper en la inferència estadística

3.4. El problema de l'estimació. Tipus d'estimadors.

3.5. Mètodes d'obtenció d'estimadors. Estimadors màxim versemblants  i estimadors bayesianos.

3.6. Propietats dels estimadors.

3.7. Aplicacions: Estimació de l'error estàndard i càlcul de la grandària mostral

 

Unitat IV Estimació mitjançant intervals de confiança.

4.1. Estimadors per interval: intervals de confiança

4.2. Intervals de confiança per a característiques d'una població normal (mitjana, variància),

4.3. Els mètodes bootstrap. Estimació de l'error estàndard i intervals de confiança bootstrap.

4.4. Intervals de confiança per a proporcions binomiales

4.5. Intervals de confiança per a paràmetres en mostra grans i per a casos generals (taxes, OR, ...)

4.6  Aplicacions: Càlcul de la grandària mostral

Unitat V: Proves d'hipòtesis

5.1. Conceptes bàsics: proves d'hipòtesis i de significació, proves unilaterals i bilaterals, tipus d'error, valors crítics de test i p-valors

5.2. Potència d'un test. Càlculs de potència i de grandària de la mostra. Grandària de l'efecte.

5.3. Mètodes de construcció de tests.

5.4. Proves de normalitat.Proves gràfiques.  El test de Shapiro-Wilks

5.5. Proves d'hipòtesis per constrastar variables quantitatives: Proves Paramètricas t-test i Anova

5.6 Proves d'hipòtesis per constrastar variables quantitatives: Proves d'hipòtesis no paramètricas de Wilcoxon i Kruskal-Wallis

 

Unitat VI: Aplicacions dels tests estadístics

6.1. Contrastos per a dades categòriques. Proves binomiales, ji quadrat i test de Fisher.

6.2. Risc relatiu i raó de «odds»

6.3. Test exacte de Fisher.

6.4. Tests ji quadrat. Proves d'independència, d'homogeneïtat i de bondat d'ajust

 

Unitat VII: Mètodes de computació intensiva i comparacions múltiples

7.1. Tests de permutacions; Què?, Quan?, Com?

7.2. El bootstrap en contrast d'hipòtesi

7.3 El problema de les comparacions múltiples

7.4. Mètodes de control d'error: FWER i FDR

 

 

Amunt

Vídeo de presentación de la asignatura Audiovisual
Vídeo de presentació de l'assignatura Audiovisual
Estadística PDF
Estadística PDF
Inferencia estadística. Introducción y plan docente Audiovisual
Inferència estadística. Introducció i pla docent Audiovisual
2. Probabilitat i variables aleatòries II Audiovisual
4. Introducció a la inferència estadística. Intervals de confiança Audiovisual
Inferencia estadística. Probabilidad y variables aleatorias I Audiovisual
3. Introducción a la inferencia estadística. Muestreo y estimación Audiovisual
Inferència estadística. Probabilitat i variables aleatòries I Audiovisual
Inferencia estadística. Aplicación de pruebas de hipótesis Audiovisual
3. Introducció a la inferència estadística. Mostreig i estimació Audiovisual
Inferència estadística. Aplicació de proves d'hipòtesis Audiovisual
5. Contrasts d'hipòtesis Audiovisual
2. Probabilidad y variables aleatorias II Audiovisual
4. Introducción a la inferencia estadística. Intervalos de confianza Audiovisual
5. Contrastes de hipótesis Audiovisual

Amunt

Donat que la bioestadística es una ciència amb un cos de coneixement ben consolidat i que el nivell de procedència de l'alumnat es ben diferent, s'ha considerat no incloure uns apunts que siguin un plagi dels llibres existents i s'ha plantejat millor utilitzar quatre llibres de diferent nivell i enfoc, per a que cadascú trie el mes adient a les seves necessitats. Cal  recordar que l'objectiu del Master es que l'alumnat adquireixi un nivell d'especialització que le permeta aplicar els coneixements adquirits a la pràctica professional. En un entorn tan dinàmic com el que dels tòpics del màster, es d'utilitat que l'alumant sigui capaç de trobar els diversos recursos disponibles la informació que necessita.

En cada unitat s'indicara el llibre i capítol que serveix de base per a la millor comprensió del contingut.

A més en la prescenciació de la untiat s'inclouran els principals punts que cal retindre, afegint petits resumens. A modus experimental s'inclouran petits videos explicatius dels continguts del curs, aíxí com de cada untiat per facilitar la comprensió dels temes.

A més es proporcionaran debats de caràcter voluntari que tractaran els principals punts del tema des de un punt de vista pràctic i conceptual De la discussió entre l'alumant i la presentació final dels exercicis resolts es preten fixar els continguts del tema. 

La descripció general dels llibres es la següent. 

És un text de bioestadística en castellà de la Universitat de Màlaga que desenvolupa molt bé la matèria del curs i que disposa d'exercicis i preguntes test per a autoavaluació, té una versió en paper: Rius F, Wärnberg J (2014): Bioestadística 2ª Edició. Ed. Paranimfo.  Per aquells que entreu de nou en el mon de la bioestadística o tingueu dificultats amb l'anglés, aquest  aquest llibre es de fàcil comprensió, però te algunes mancances en algún punt i alguns errors en algunes fórmules d'algún punt concret de del temari que us comentarem. 

 

Si haguèssim d'indicar un llibre com de text del curs,aquest seria l'indicat.

Si tuvieramos que indicar algún libro como de texto único este sería el indicat, encara que la darrera unitat del curs de remostreig no està inclosa. Els continguts del curs comencen a partir del tema 4, però es recomanable que us llegiu els anteriors, donat que inclouen els conceptes d'estadística descriptiva que heu vist en els vostres estudis anteriors , amb aplicacions en R, que es el llenguaje que utilitzarem com usuaris a lo llarg del curs. El millor del llibre es que combina l'explicació teòrica amb la práctica en R, el que ajuda a comprende els continguts. El llibre el teniu al vostre abast en la biblioteca de la UOC seguint els enllaços

Combina un enfocament tradicional, i no elemental, de l'estadística amb un plantejament a partir de problemes generats per la bioinformàtica, especialment l'anàlisi de dades de microarrays. La característica més notable d'aquest llibre és que es recolza constantment en el llenguatge R amb la finalitat d'il·lustrar els conceptes mitjançant càlculs, gràfics o simulacions pel que una vegada més es pot seguir de diverses formes. A vegades el torna complexe en la forma com tracta la resolució pràctica de les diferents qüestions en R, sobrettot si no s'esta molt introduït en el mon de la bioinformatica Aquest llibre el podeu trobar a la biblioteca en forma electrònica i es podria considerar el llibre de text de l'assignatura. .

Aquest llibre que teniu disponible en la biblioteca dels cursos que, des de la Universitat Johns Hopkins, organitzen en Coursera  està molt ben estructurat i contempla tots els aspectes d'una forma resumida per a l'anàlisi de dades en ciència. El llibre és senzill de seguir i a  més podeu accedir als vídeos desenvolupats pels autor  que acompanyen  les sessions que us poden ajudar a entendre alguns aspectes. Alguns punts estan desenvolupats d'una manera molt esquemàtica. Per a la comprensió de la darrera unitat es el millor llibre

Altres materials de suport

A més dels llibres esmentats s'inclouen altres materials que poden ser útils al llarg de el curs. També en les diferents unitats, a més del vídeo de presentació dels diferents materials, s'inclouran alguns enllaços a recursos web, applets i resums que poden ajudar a millorar la informació

Auquest text és un manual d'ús transversal en diferents assignatures del Máster que va des de l'estadística bàsica fins a anàlisis més sofisticades de bioinformàtica, utilitzant l'R com software de suport. El llibre recull els principals conceptes i mostra exemples d'ús de la bioestadística, si be no recull tota la informació necessaria.

 Aquest material s'utilitza en la assignatura d'estadística en diversos graus de la UOC com Data Science i Informàtica. Esta ben explicat amb nombrosos exemples. Encara que el seu contingut no es exactament el de l'assignatura del Máster pot ser tuilitzat per reafirmar alguns conceptes i temes.

Amunt

El procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat dels exercicis realitzats.

La manca d'autenticitat en l'autoria o d'originalitat de les proves d'avaluació; la còpia o el plagi; l'intent fraudulent d'obtenir un resultat acadèmic millor; la col·laboració, l'encobriment o l'afavoriment de la còpia, o la utilització de material o dispositius no autoritzats durant l'avaluació, entre d'altres, són conductes irregulars que poden tenir conseqüències acadèmiques i disciplinàries greus.

D'una banda, si es detecta alguna d'aquestes conductes irregulars, pot comportar el suspens (D/0) en les activitats avaluables que es defineixin en el pla docent –incloses les proves finals– o en la qualificació final de l'assignatura, sigui perquè s'han utilitzat materials o dispositius no autoritzats durant les proves, com ara xarxes socials o cercadors d'informació a internet, perquè s'han copiat fragments de text d'una font externa (internet, apunts, llibres, articles, treballs o proves d'altres estudiants, etc.) sense la citació corresponent, o perquè s'ha practicat qualsevol altra conducta irregular.

De l'altra, i d'acord amb les normatives acadèmiques, les conductes irregulars en l'avaluació, a més de comportar el suspens de l'assignatura, poden donar lloc a la incoació d'un procediment disciplinari i a l'aplicació, si escau, de la sanció que correspongui.

Amunt

L'assignatura només es pot aprovar amb el seguiment i la superació de l'avaluació contínua (AC). La qualificació final de l'assignatura és la nota obtinguda a l'AC.

 

Amunt