Programació en scripting Codi:  22.402    :  6
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Camps professionals en què es projecta   Coneixements previs   Informació prèvia a la matrícula   Objectius i competències   Continguts   Consulta dels recursos d'aprenentatge de la UOC per a l'assignatura   Informació addicional sobre els recursos d'aprenentatge i eines de suport   Informacions sobre l'avaluació a la UOC   Consulta del model d'avaluació  
Aquest és el pla docent de l'assignatura per al primer semestre del curs 2024-2025. Podeu consultar si l'assignatura s'ofereix aquest semestre a l'espai del campus Més UOC / La universitat / Plans d'estudis). Un cop comenci la docència, heu de consultar-lo a l'aula. El pla docent pot estar subjecte a canvis.

Una de les eines que tot científic de dades ha de dominar és la línia de comandes del sistema operatiu, especialment en el cas de GNU/Linux o similars. Es tracta d'una eina molt potent que permet extreure tot el profit a les possibilitats que ofereixen el maquinari juntament amb el sistema operatiu instal·lat. Des de la línia de comandes es poden fer tasques de manteniment i actualització del sistema operatiu, manipular fitxers i processos, i executar una infinitat d'utilitats i eines que permeten resoldre problemes concrets. Aquestes eines es poden combinar amb les comandes del sistema operatiu, mitjançant l'ús d'scripts, en petits programes que són interpretats i executats pel propi sistema operatiu, amb l'objectiu d'automatitzar tasques habituals.

En general, des de la línia de comandes es poden resoldre molts dels problemes lligats a les etapes inicials del cicle de vida de les dades, especialment les de captura, preprocessat i emmagatzemament. En aquesta assignatura es mostren exemples d'eines que resolen problemes típics, en forma de casos resolts.

És important tenir en compte que en aquesta assignatura es dóna molta importància als detalls: l'ús de les ordres més adequats (de vegades és possible fer el mateix de diferents maneres més o menys eficients), la sintaxi estricta (paràmetres usats, noms de variables, textos, ús de cometes i altres caràcters especials, etc.) i l'exactitud dels resultats obtinguts. Penseu que es tracta d'una assignatura on l'objectiu és automatitzar tasques per poder "desentendre's" i executar-les sense supervisió, de manera que tots els exercicis que es plantejaran s'hauran de realitzar tenint en compte aquest grau de precisió requerit.

Amunt

Aquesta assignatura introdueix els estudiants en l'ús de les comandes i altres eines lligades al sistema operatiu, sent així una assignatura fonamental per extreure el màxim profit de les possibilitats d'un entorn de treball adequat per a la ciència de dades. Les competències treballades en aquesta assignatura serviran per poder desenvolupar projectes de ciència de dades en totes les fases del cicle de vida de les dades, proporcionant solucions ad-hoc per a resoldre problemes típics. Es tracta, doncs, d'una caixa d'eines que podrà ser usada en moltes altres situacions.

Amunt

El perfil professional que desenvolupa aquesta assignatura és més proper a un administrador de sistemes, responsable de la infraestructura tecnològica, i també a l'anomenat data engineer, responsable de capturar, manipular i emmagatzemar dades per a la seva anàlisi posterior. No obstant això, es tracta d'una assignatura que proporciona unes competències bàsiques per a qualsevol científic de dades, sigui quin sigui el seu àmbit d'actuació.

Amunt

Aquesta assignatura pressuposa que l'estudiant té uns coneixements bàsics de programació estructurada, els quals són necessaris per a la creació de petits scripts usats en els exercicis pràctics, usant els constructes bàsics.

Com és habitual en l'àmbit de la ciència de dades, es manipularan dades, recursos online i eines que només es troben disponibles en idioma anglès, sent necessari poder llegir i usar recursos en aquesta llengua.

Amunt

En aquesta assignatura els estudiants hauran de crear entorns virtuals emprant GNU/Linux per realitzar les activitats pràctiques proposades. Per aquest motiu, és necessari disposar d'un ordinador amb almenys un processador dual core de 2GHz, 4Gb de memòria RAM (recomanable 8Gb) i 30Gb d'espai de disc (recomanable 50Gb).

Amunt

Els objectius que es pretenen assolir mitjançant aquesta assignatura són els següents:
  • Ser capaços de configurar un entorn de treball personal per a projectes de l'àmbit de la ciència de dades.
  • Dominar les comandes del sistema operatiu GNU/Linux.
  • Conèixer un seguit d'eines i utilitats que resolen problemes típics relacionats amb la captura i manipulació de dades.
  • Desenvolupar petits scripts per a l'automatització de tasques típiques. 

Les competències específiques que es treballen a aquesta assignatura són les següents:
  • Dissenyar i construir aplicacions analítiques mitjançant tècniques de desenvolupament, integració i reutilització de components de programari.
  • Aplicar tècniques específiques de captura, tractament i anàlisi de dades estructurades, semi-estructurades i no estructurades.
  • Administrar i gestionar els sistemes operatius i les comunicacions dels components d'una xarxa d'ordinadors.

Amunt

Els continguts docents que es treballen en aquesta assignatura són els següents:

  • L'entorn de treball del científic de dades.
  • Fonaments bàsics dels sistemes operatius.
  • Utilització del sistema operatiu GNU/Linux.
  • Expresions regulars.
  • La creació de scripts mitjançant bash.
  • El llenguatge awk.
  • Exemples: casos d'ús de la línia de comandes. Exemples concrets d'obtenció, filtre, manipulació, transformació i presentació de dades.

Amunt

Espai de recursos de ciència de dades Web

Amunt

Com és habitual en les assignatures on cal desenvolupar petits programes, és possible que no tots els recursos necessaris per a la resolució de les diferents PAC i la Pràctica es trobin en els recursos d'aprenentatge proposats a l'aula. Aquests actuen com a guies principals que estableixen els marcs de treball i descriuen les eines més importants. No obstant això, és possible que s'hagin de buscar i provar altres recursos a la xarxa. De fet, buscar, interpretar i aplicar configuracions de sistemes operatius, comandaments de GNU/Linux i bash, expressions amb sed i grep, i programes escrits en awk, ha de ser una competència que ha de ser adquirida pels estudiants durant el transcurs de aquesta assignatura, com a part del seu aprenentatge.

L'assignatura també treu profit de l'espai de recursos oberts de ciència de dades (https://datascience.recursos.uoc.edu/), on els estudiants poden trobar un recull d'eines i exemples semblants als descrits en els materials docents, així com d'altres relacionats.

Amunt

El procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat dels exercicis realitzats.

La manca d'autenticitat en l'autoria o d'originalitat de les proves d'avaluació; la còpia o el plagi; l'intent fraudulent d'obtenir un resultat acadèmic millor; la col·laboració, l'encobriment o l'afavoriment de la còpia, o la utilització de material, programari o dispositius no autoritzats durant l'avaluació, entre altres, són conductes irregulars en l'avaluació que poden tenir conseqüències acadèmiques i disciplinàries greus.

Aquestes conductes irregulars poden comportar el suspens (D/0) en les activitats avaluables que es defineixin en el pla docent -incloses les proves finals- o en la qualificació final de l'assignatura, sigui perquè s'han utilitzat materials, programari o dispositius no autoritzats durant les proves, com ara xarxes socials o cercadors d'informació a internet, perquè s'han copiat fragments de text d'una font externa (internet, apunts, llibres, articles, treballs o proves d'altres estudiants, etc.) sense la citació corresponent, o perquè s'ha dut a terme qualsevol altra conducta irregular.

Així mateix, i d'acord amb la normativa acadèmica, les conductes irregulars en l'avaluació també poden donar lloc a la incoació d'un procediment disciplinari i a l'aplicació, si escau, de la sanció que correspongui, de conformitat amb l'establert a la normativa de convivència de la UOC.

En el marc del procés d'avaluació, la UOC es reserva la potestat de:

  • Sol·licitar a l'estudiant que acrediti la seva identitat segons l'establert a la normativa acadèmica.
  • Sol·licitar a l'estudiant que acrediti l'autoria del seu treball al llarg de tot el procés d'avaluació, tant avaluació contínua com avaluació final, per mitjà d'una prova oral o els mitjans síncrons o asíncrons que estableixi la Universitat. Aquests mitjans tindran per objecte verificar els coneixements i les competències que garanteixin l'autoria; en cap cas no implicaran una segona avaluació. Si no és possible garantir l'autoria de l'estudiant, la prova serà qualificada amb D, en el cas de l'avaluació contínua, o amb un Suspens, en el cas de l'avaluació final.

    A aquests efectes, la UOC pot exigir a l'estudiant l'ús d'un micròfon, una càmera o altres eines durant l'avaluació; és responsabilitat de l'estudiant assegurar que aquests dispositius funcionen correctament.

Amunt

L'assignatura només es pot aprovar amb el seguiment i la superació de l'avaluació contínua (AC). La qualificació final de l'assignatura és la nota obtinguda a l'AC.

 

Amunt