|
||||||||||||||||||||||||||||||||
Consulta de les dades generals Descripció L'assignatura en el conjunt del pla d'estudis Camps professionals en què es projecta Coneixements previs Informació prèvia a la matrícula Objectius i competències Continguts Consulta dels recursos d'aprenentatge de la UOC per a l'assignatura Informació addicional sobre els recursos d'aprenentatge i eines de suport Informacions sobre l'avaluació a la UOC Consulta del model d'avaluació | ||||||||||||||||||||||||||||||||
Aquest és el pla docent de l'assignatura per al primer semestre del curs 2024-2025. Podeu consultar si l'assignatura s'ofereix aquest semestre a l'espai del campus Més UOC / La universitat / Plans d'estudis). Un cop comenci la docència, heu de consultar-lo a l'aula. El pla docent pot estar subjecte a canvis. | ||||||||||||||||||||||||||||||||
Machine learning va néixer com una branca de la intel·ligència artificial amb l'objectiu que una maquina pogués aprendre a força d'exemples usant algun algorisme d'aprenentatge automàtic. Per tant, es necessita tenir exemples, és a dir dades, un algorisme que ajudi a aprendre, basat en mètodes estadístics, i una màquina, ordinador en general, amb suficient potència de càlcul i capacitat de memòria. Al món actual es té una gran disponibilitat de dades, en particular al món de la bioinformática. Això fa que les tècniques de machine learning s'apliquin cada vegada amb major freqüència, com per exemple per a l'anotació automàtica de genomes i l'anàlisi de les dades òmiques obtingudes en experiments amb tecnologies d'alt rendiment. En aquest curs de machine learning es presenten conceptes bàsics, algorismes i aplicacions del machine learning en l'àmbit de la bioinformática. En particular, s'estudien les següents metodologies d'aprenentatge supervisat:
En cadascuna de les anteriors metodologies farem una introducció dels conceptes subjacents i després s'implementarà una aplicació usant el programari R, donant importància a la generació d'informes dinàmics per a la presentació dels resultats. Amb aquesta finalitat s'han seleccionat exemples reals en bioinformática o biomedicina que es tractaran durant el curs. Algunes unitats també es desenvoluparan utilitzant el programari Python. A més dels algorismes hi ha una unitat didàctica, la III, de caràcter transversal, on s'estudiarà l'avaluació del rendiment d'un model. En aquesta unitat es presenten els mètodes d'avaluació dels classificadors, com són les mesures de rendiment: especificitat, sensibilitat, etc i les mètodes de remuestreo: cross-validation, bootstrap, etc. |
||||||||||||||||||||||||||||||||
Aquesta assignatura optativa reforça el coneixement en anàlisi predictiva i introdueix l'estudiant al món del data science i el big data. |
||||||||||||||||||||||||||||||||
En acabar aquesta assignatura l'estudiant coneixerà les eines bàsiques de data science que li habilitaran per incorporar-se en grups/empreses que desenvolupin activitat a l'àrea del machine learning i les ciències òmiques. Exemples de perfils professionals que fan un ús important dels conceptes i tècniques desenvolupats en aquesta assignatura són els següents:
|
||||||||||||||||||||||||||||||||
Aquesta assignatura pot afrontar-se amb els següents coneixements previs.
Si en algun moment del curs, l'estudiant precisa reforçar algun àrea se li facilitarà les referències en les quals acudir per a la seva formació, a més de comptar amb les explicacions del docent de l'aula. |
||||||||||||||||||||||||||||||||
És recomanable que l'estudiant hagi superat Regressió, Models i Mètodes abans de cursar aquesta assignatura, i també que tingui adquirides les competències que es tracten en l'assignatura Biologia Molecular. |
||||||||||||||||||||||||||||||||
Aquesta assignatura mostra un conjunt de tècniques de machine learning supervisat per a l'anàlisi de dades pròpies de les ciències òmiques. Durant el curs s'adquiriran les següents capacitats:
Segons la memòria del Màster Universitari en Bioinformática i Bioestadística, aprovada per les Agències Oficials de Qualitat Docent Universitària (AQU), en aquesta assignatura es garanteixen les següents competències:
|
||||||||||||||||||||||||||||||||
Els continguts s'organitzen per temes, els quals s'agrupen en unitats, que és el bloc d'informació tal com es veu a l'aula.
Unitat I. Introducció a Machine Learning 1.1. Els orígens del Machine Learning. 1.2. Com aprenen les màquines? 1.3. Passos en la implementació de Machine Learning. 1.4. L'elecció de l'algorisme de Machine Learning 1.5. Elements bàsics de R. 1.6. Machine Learning amb R i informes dinàmics.
Unitat II: Algorisme de k-veïns més propers (kNN) 2.1. Comprendre la classificació amb els veïns més propers. 2.2 L'algorisme kNN. 2.3 Distàncies entre dades. 2.4 Elecció d'una k adequada. 2.5. Preparant les dades 2.6. Exemple d'aplicació.
Unitat III: Avaluació del rendiment del model. 3.1. Mesures del rendiment d'un classificador. 3.2. Matriu de confusió. Mesures associades 3.3. Corbes ROC 3.4. Tècniques de mostreig per a l'avaluació del rendiment del model.
Unitat IV: Classificació usant Naive Bayes. 4.1. Comprendre la classificació amb Naive Bayes. 4.2. Conceptes bàsics dels mètodes Bayesians. 4.3. L'Algorisme de Naive Bayes. 4.4. Exemple d'aplicació.
Unitat V: Xarxes neuronals artificials. 5.1. Comprendre les xarxes neuronals artificials. 5.2. Topologia de la xarxa. 5.3. Backpropagation. 5.4. Exemple d'aplicació. 5.5. Deep Learning
Unitat VI: Support Vector Machines (SVM). 6.1. Classificació amb hiperplans. 6.2. Trobar l'hiperplà de marge màxim. 6.3. L'ús de funcions kernel en problemes no lineals. 6.4. Exemple d'aplicació.
Unitat VII: Arbres de decisió i Random Forests. 7.1. Comprendre els arbres de decisió. 7.2. Poda de l'arbre de decisió. 7.3 Exemple d'aplicació. 7.4. Comprendre el Random Forests. 7.5. Exemple d'aplicació.
Unitat VIII: Aplicació oberta de Machine Learning 8.1 Cerca de bases de dades públiques. 8.2 Implementació d'un pipeline de Machine Learning en una base de dades pública. |
||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||
En aquesta assignatura s'usa com a manual del curs el següent llibre: Lantz (2015) Machine learning with R. Second edition . Ed. Packt També s'utilitzaran materials elaborats per l'equip docent, que estaran disponibles a l'aula. |
||||||||||||||||||||||||||||||||
A la UOC, l'avaluació generalment és virtual. S'estructura entorn de l'avaluació contínua, que inclou diferents activitats o reptes; l'avaluació final, que es porta a terme mitjançant proves o exàmens, i el treball final de la titulació. Les activitats o proves d'avaluació poden ser escrites i/o audiovisuals, amb preguntes aleatòries, proves orals síncrones o asíncrones, etc., d'acord amb el que decideixi cada equip docent. Els treballs finals representen el tancament d'un procés formatiu que implica la realització d'un treball original i tutoritzat que té com a objectiu demostrar l'adquisició competencial feta al llarg del programa. Per verificar la identitat de l'estudiant i l'autoria de les proves d'avaluació, la UOC es reserva la potestat d'aplicar diferents sistemes de reconeixement de la identitat i de detecció del plagi. Amb aquest objectiu, la UOC pot dur a terme enregistrament audiovisual o fer servir mètodes o tècniques de supervisió durant l'execució de qualsevol activitat acadèmica. Així mateix, la UOC pot exigir a l'estudiant l'ús de dispositius electrònics (micròfons, càmeres o altres eines) o programari específic durant l'avaluació. És responsabilitat de l'estudiant assegurar que aquests dispositius funcionen correctament. El procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat de les activitats acadèmiques. Al web sobre integritat acadèmica i plagi de la UOC hi ha més informació respecte d'aquesta qüestió. La manca d'autenticitat en l'autoria o d'originalitat de les proves d'avaluació; la còpia o el plagi; la suplantació d'identitat; l'acceptació o l'obtenció de qualsevol activitat acadèmica a canvi d'una contraprestació o no; la col·laboració, l'encobriment o l'afavoriment de la còpia, o l'ús de material, programari o dispositius no autoritzats en el pla docent o l'enunciat de l'activitat acadèmica, inclosa la intel·ligència artificial i la traducció automàtica, entre altres, són conductes irregulars en l'avaluació que poden tenir conseqüències acadèmiques i disciplinàries greus. Aquestes conductes irregulars poden comportar el suspens (D/0) en les activitats avaluables que es defineixin en el pla docent -incloses les proves finals- o en la qualificació final de l'assignatura, sigui perquè s'han utilitzat materials, programari o dispositius no autoritzats durant les proves (com l'ús d'intel·ligència artificial no permesa, xarxes socials o cercadors d'informació a internet), perquè s'han copiat fragments de text d'una font externa (internet, apunts, llibres, articles, treballs o proves d'altres estudiants, etc.) sense la citació corresponent, per la compravenda d'activitats acadèmiques, o perquè s'ha dut a terme qualsevol altra conducta irregular. Així mateix, i d'acord amb la normativa acadèmica, les conductes irregulars en l'avaluació també poden donar lloc a la incoació d'un procediment disciplinari i a l'aplicació, si escau, de la sanció que correspongui, de conformitat amb el que estableix la normativa de convivència de la UOC. En el marc del procés d'avaluació, la UOC es reserva la potestat de:
Intel·ligència artificial en el marc de l'avaluació La UOC reconeix el valor i el potencial de la intel·ligència artificial (IA) en l'àmbit educatiu, alhora que posa de manifest els riscos que comporta si no s'utilitza de manera ètica, crítica i responsable. En aquest sentit, en cada activitat d'avaluació s'informarà l'estudiantat sobre les eines i els recursos d'IA que es poden utilitzar i en quines condicions. Per la seva banda, l'estudiantat es compromet a seguir les indicacions de la UOC a l'hora de dur a terme les activitats d'avaluació i de citar les eines utilitzades i, concretament, a identificar els textos o les imatges generats per sistemes d'IA, els quals no podrà presentar com si fossin propis. Amb relació a fer servir o no la IA per resoldre una activitat, l'enunciat de les activitats d'avaluació indica les limitacions en l'ús d'aquestes eines. Cal tenir en compte que fer-les servir de manera inadequada, com ara en activitats en què no estan permeses o no citar-les en les activitats en què sí que ho estan, es pot considerar una conducta irregular en l'avaluació. En cas de dubte, es recomana que, abans de lliurar l'activitat, es faci arribar una consulta al professorat col·laborador de l'aula. |
||||||||||||||||||||||||||||||||
|