Programació en scripting Codi:  22.402    :  6
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Camps professionals en què es projecta   Coneixements previs   Informació prèvia a la matrícula   Objectius i competències   Continguts   Consulta dels recursos d'aprenentatge de què disposa l'assignatura   Recursos d'aprenentatge i eines de suport   Informacions sobre l'avaluació a la UOC   Consulta del model d'avaluació  
Aquest és el pla docent de l'assignatura per al segon semestre del curs 2023-2024. Podeu consultar si l'assignatura s'ofereix aquest semestre a l'espai del campus Més UOC / La universitat / Plans d'estudis). Un cop comenci la docència, heu de consultar-lo a l'aula. El pla docent pot estar subjecte a canvis.

Una de les eines que tot científic de dades ha de dominar és la línia de comandes del sistema operatiu, especialment en el cas de GNU/Linux o similars. Es tracta d'una eina molt potent que permet extreure tot el profit a les possibilitats que ofereixen el maquinari juntament amb el sistema operatiu instal·lat. Des de la línia de comandes es poden fer tasques de manteniment i actualització del sistema operatiu, manipular fitxers i processos, i executar una infinitat d'utilitats i eines que permeten resoldre problemes concrets. Aquestes eines es poden combinar amb les comandes del sistema operatiu, mitjançant l'ús d'scripts, en petits programes que són interpretats i executats pel propi sistema operatiu, amb l'objectiu d'automatitzar tasques habituals.

En general, des de la línia de comandes es poden resoldre molts dels problemes lligats a les etapes inicials del cicle de vida de les dades, especialment les de captura, preprocessat i emmagatzemament. En aquesta assignatura es mostren exemples d'eines que resolen problemes típics, en forma de casos resolts.

És important tenir en compte que en aquesta assignatura es dóna molta importància als detalls: l'ús de les ordres més adequats (de vegades és possible fer el mateix de diferents maneres més o menys eficients), la sintaxi estricta (paràmetres usats, noms de variables, textos, ús de cometes i altres caràcters especials, etc.) i l'exactitud dels resultats obtinguts. Penseu que es tracta d'una assignatura on l'objectiu és automatitzar tasques per poder "desentendre's" i executar-les sense supervisió, de manera que tots els exercicis que es plantejaran s'hauran de realitzar tenint en compte aquest grau de precisió requerit.

Amunt

Aquesta assignatura introdueix els estudiants en l'ús de les comandes i altres eines lligades al sistema operatiu, sent així una assignatura fonamental per extreure el màxim profit de les possibilitats d'un entorn de treball adequat per a la ciència de dades. Les competències treballades en aquesta assignatura serviran per poder desenvolupar projectes de ciència de dades en totes les fases del cicle de vida de les dades, proporcionant solucions ad-hoc per a resoldre problemes típics. Es tracta, doncs, d'una caixa d'eines que podrà ser usada en moltes altres situacions.

Amunt

El perfil professional que desenvolupa aquesta assignatura és més proper a un administrador de sistemes, responsable de la infraestructura tecnològica, i també a l'anomenat data engineer, responsable de capturar, manipular i emmagatzemar dades per a la seva anàlisi posterior. No obstant això, es tracta d'una assignatura que proporciona unes competències bàsiques per a qualsevol científic de dades, sigui quin sigui el seu àmbit d'actuació.

Amunt

Aquesta assignatura pressuposa que l'estudiant té uns coneixements bàsics de programació estructurada, els quals són necessaris per a la creació de petits scripts usats en els exercicis pràctics, usant els constructes bàsics.

Com és habitual en l'àmbit de la ciència de dades, es manipularan dades, recursos online i eines que només es troben disponibles en idioma anglès, sent necessari poder llegir i usar recursos en aquesta llengua.

Amunt

En aquesta assignatura els estudiants hauran de crear entorns virtuals emprant GNU/Linux per realitzar les activitats pràctiques proposades. Per aquest motiu, és necessari disposar d'un ordinador amb almenys un processador dual core de 2GHz, 4Gb de memòria RAM i 25Gb d'espai de disc.

Amunt

Els objectius que es pretenen assolir mitjançant aquesta assignatura són els següents:
  • Ser capaços de configurar un entorn de treball personal per a projectes de l'àmbit de la ciència de dades.
  • Dominar les comandes del sistema operatiu GNU/Linux.
  • Conèixer un seguit d'eines i utilitats que resolen problemes típics relacionats amb la captura i manipulació de dades.
  • Desenvolupar petits scripts per a l'automatització de tasques típiques. 

Les competències específiques que es treballen a aquesta assignatura són les següents:
  • Dissenyar i construir aplicacions analítiques mitjançant tècniques de desenvolupament, integració i reutilització de components de programari.
  • Aplicar tècniques específiques de captura, tractament i anàlisi de dades estructurades, semi-estructurades i no estructurades.
  • Administrar i gestionar els sistemes operatius i les comunicacions dels components d'una xarxa d'ordinadors.

Amunt

Els continguts docents que es treballen en aquesta assignatura són els següents:

  • L'entorn de treball del científic de dades.
  • Fonaments bàsics dels sistemes operatius.
  • Utilització del sistema operatiu GNU/Linux.
  • Expresions regulars.
  • La creació de scripts mitjançant bash.
  • El llenguatge awk.
  • Exemples: casos d'ús de la línia de comandes. Exemples concrets d'obtenció, filtre, manipulació, transformació i presentació de dades.

Amunt

Espai de recursos de ciència de dades Web

Amunt

Com és habitual en les assignatures on cal desenvolupar petits programes, és possible que no tots els recursos necessaris per a la resolució de les diferents PAC i la Pràctica es trobin en els recursos d'aprenentatge proposats a l'aula. Aquests actuen com a guies principals que estableixen els marcs de treball i descriuen les eines més importants. No obstant això, és possible que s'hagin de buscar i provar altres recursos a la xarxa. De fet, buscar, interpretar i aplicar configuracions de sistemes operatius, comandaments de GNU/Linux i bash, expressions amb sed i grep, i programes escrits en awk, ha de ser una competència que ha de ser adquirida pels estudiants durant el transcurs de aquesta assignatura, com a part del seu aprenentatge.

L'assignatura també treu profit de l'espai de recursos oberts de ciència de dades (http://datascience.recursos.uoc.edu/), on els estudiants poden trobar un recull d'eines i exemples semblants als descrits en els materials docents, així com d'altres relacionats.

Amunt

El procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat dels exercicis realitzats.

La manca d'autenticitat en l'autoria o d'originalitat de les proves d'avaluació; la còpia o el plagi; l'intent fraudulent d'obtenir un resultat acadèmic millor; la col·laboració, l'encobriment o l'afavoriment de la còpia, o la utilització de material o dispositius no autoritzats durant l'avaluació, entre d'altres, són conductes irregulars que poden tenir conseqüències acadèmiques i disciplinàries greus.

D'una banda, si es detecta alguna d'aquestes conductes irregulars, pot comportar el suspens (D/0) en les activitats avaluables que es defineixin en el pla docent –incloses les proves finals– o en la qualificació final de l'assignatura, sigui perquè s'han utilitzat materials o dispositius no autoritzats durant les proves, com ara xarxes socials o cercadors d'informació a internet, perquè s'han copiat fragments de text d'una font externa (internet, apunts, llibres, articles, treballs o proves d'altres estudiants, etc.) sense la citació corresponent, o perquè s'ha practicat qualsevol altra conducta irregular.

De l'altra, i d'acord amb les normatives acadèmiques, les conductes irregulars en l'avaluació, a més de comportar el suspens de l'assignatura, poden donar lloc a la incoació d'un procediment disciplinari i a l'aplicació, si escau, de la sanció que correspongui.

Amunt

Aquesta assignatura només es pot superar a partir de l'avaluació contínua (AC), nota que es combina amb una nota de pràctiques (Pr) per a obtenir la nota final de l'assignatura. No es preveu fer cap prova d'avaluació final. La fórmula d'acreditació de l'assignatura és la següent: AC + Pr.

 
 

Amunt