Programació en scripting Codi:  22.402    :  6
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Camps professionals en què es projecta   Coneixements previs   Objectius i competències   Continguts   Consulta dels recursos d'aprenentatge de què disposa l'assignatura   Recursos d'aprenentatge i eines de suport   Consulta del model d'avaluació  
ATENCIÓ: Aquest és el pla docent de l'assignatura per al primer semestre del curs 2020-2021. Us servirà per planificar la matrícula. Un cop comenci la docència, heu de consultar-lo a l'aula. (El pla docent pot estar subjecte a canvis.)

Una de les eines que tot científic de dades ha de dominar és la línia de comandes del sistema operatiu, especialment en el cas de GNU/Linux o similars. Es tracta d'una eina molt potent que permet extreure tot el profit a les possibilitats que ofereixen el maquinari juntament amb el sistema operatiu instal·lat. Des de la línia de comandes es poden fer tasques de manteniment i actualització del sistema operatiu, manipular fitxers i processos, i executar una infinitat d'utilitats i eines que permeten resoldre problemes concrets. Aquestes eines es poden combinar amb les comandes del sistema operatiu, mitjançant l'ús d'scripts, en petits programes que són interpretats i executats pel propi sistema operatiu, amb l'objectiu d'automatitzar tasques habituals.

En general, des de la línia de comandes es poden resoldre molts dels problemes lligats a les etapes inicials del cicle de vida de les dades, especialment les de captura, preprocessat i emmagatzemament. En aquesta assignatura es mostren exemples d'eines que resolen problemes típics, en forma de casos resolts.

Amunt

Aquesta assignatura introdueix els estudiants en l'ús de les comandes i altres eines lligades al sistema operatiu, sent així una assignatura fonamental per extreure el màxim profit de les possibilitats d'un entorn de treball adequat per a la ciència de dades. Les competències treballades en aquesta assignatura serviran per poder desenvolupar projectes de ciència de dades en totes les fases del cicle de vida de les dades, proporcionant solucions ad-hoc per a resoldre problemes típics. Es tracta, doncs, d'una caixa d'eines que podrà ser usada en moltes altres situacions.

Amunt

El perfil professional que desenvolupa aquesta assignatura és més proper a un administrador de sistemes, responsable de la infraestructura tecnològica, i també a l'anomenat data engineer, responsable de capturar, manipular i emmagatzemar dades per a la seva anàlisi posterior. No obstant això, es tracta d'una assignatura que proporciona unes competències bàsiques per a qualsevol científic de dades, sigui quin sigui el seu àmbit d'actuació.

Amunt

Aquesta assignatura pressuposa que l'estudiant té uns coneixements bàsics de programació estructurada, els quals són necessaris per a la creació de petits scripts usats en els exercicis pràctics, usant els constructes bàsics.

Com és habitual en l'àmbit de la ciència de dades, es manipularan dades, recursos online i eines que només es troben disponibles en idioma anglès, sent necessari poder llegir i usar recursos en aquesta llengua.

Amunt

Els objectius que es pretenen assolir mitjançant aquesta assignatura són els següents:
  • Ser capaços de configurar un entorn de treball personal per a projectes de l'àmbit de la ciència de dades.
  • Dominar les comandes del sistema operatiu GNU/Linux.
  • Conèixer un seguit d'eines i utilitats que resolen problemes típics relacionats amb la captura i manipulació de dades.
  • Desenvolupar petits scripts per a l'automatització de tasques típiques. 

Les competències específiques que es treballen a aquesta assignatura són les següents:
  • Dissenyar i construir aplicacions analítiques mitjançant tècniques de desenvolupament, integració i reutilització de components de programari.
  • Aplicar tècniques específiques de captura, tractament i anàlisi de dades estructurades, semi-estructurades i no estructurades.
  • Administrar i gestionar els sistemes operatius i les comunicacions dels components d'una xarxa d'ordinadors.

Amunt

Els continguts docents que es treballen en aquesta assignatura són els següents:

  • L'entorn de treball del científic de dades.
  • Fonaments bàsics dels sistemes operatius.
  • Utilització del sistema operatiu GNU/Linux.
  • Expresions regulars.
  • La creació de scripts mitjançant bash.
  • El llenguatge awk.
  • Exemples: casos d'ús de la línia de comandes. Exemples concrets d'obtenció, filtre, manipulació, transformació i presentació de dades.

Amunt

Espai de recursos de ciència de dades Web

Amunt

És possible que no tots els coneixements i recursos necessaris per a la resolució de les diferents PAC es trobin en els recursos d'aprenentatge proposats a l'aula. Aquests actuen com a guies principals que estableixen els marcs de treball i descriuen les eines més importants. No obstant això, és possible que s'hagin de buscar i provar altres recursos a la xarxa. De fet, buscar, interpretar i aplicar configuracions de sistemes operatius, comandaments de GNU/Linux i bash, expressions amb sed i grep, i programes escrits en awk, ha de ser una competència que ha de ser adquirida pels estudiants durant el transcurs de aquesta assignatura, com a part del seu aprenentatge.

L'assignatura també treu profit de l'espai de recursos oberts de ciència de dades (http://datascience.recursos.uoc.edu/), on els estudiants poden trobar un recull d'eines i exemples semblants als descrits en els materials docents, així com d'altres relacionats.

Amunt

Aquesta assignatura només es pot superar a partir de l'avaluació contínua (AC). La nota final d'avaluació contínua esdevé la nota final de l'assignatura. La fórmula d'acreditació de l'assignatura és la següent: AC.

 

Amunt