Programación en scripting Código:  22.502    :  6
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en el que se proyecta   Conocimientos previos   Información previa a la matrícula   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de la UOC para la asignatura   Información adicional sobre los recursos de aprendizaje y herramientas de apoyo   Informaciones sobre la evaluación en la UOC   Consulta del modelo de evaluación  
Este es el plan docente de la asignatura para el segundo semestre del curso 2023-2024. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

Todo científico de datos debe dominar la línea de comandos del sistema operativo, especialmente en el caso de sistemas basados en Unix tipo GNU/Linux o similares. Se trata de una herramienta muy potente que permite extraer todo el provecho a las posibilidades que ofrecen el hardware junto con el sistema operativo instalado. Desde la línea de comandos se pueden hacer tareas de mantenimiento y actualización del sistema operativo, manipular ficheros y procesos, y ejecutar una infinidad de utilidades y herramientas que permiten resolver problemas concretos. Estas herramientas se pueden combinar con los comandos del sistema operativo, mediante scripts, en pequeños programas que son interpretados y ejecutados por el propio sistema operativo, con el objetivo de automatizar tareas habituales.

En general, desde la línea de comandos se pueden resolver muchos de los problemas ligados a las etapas iniciales del ciclo de vida de los datos, especialmente las de captura, preprocesado y almacenamiento. En esta asignatura se muestran ejemplos de herramientas que resuelven problemas típicos, en forma de casos resueltos.

Es importante tener en cuenta que en esta asignatura se da mucha importancia a los detalles: el uso de los comandos más adecuados (a veces es posible hacer lo mismo de diferentes maneras más o menos eficientes), la sintaxis estricta (parámetros usados, nombres de variables, textos, uso de comillas y otros caracteres especiales, etc.) y la exactitud de los resultados obtenidos. Pensad que se trata de una asignatura donde el objetivo es automatizar tareas para poder "desentenderse" y ejecutarlas sin supervisión, por lo que todos los ejercicios que se plantearán se deberán realizar teniendo en cuenta este grado de precisión requerido.

Amunt

Esta asignatura introduce a los estudiantes en el uso de los comandos y otras herramientas ligadas al sistema operativo, siendo así una asignatura fundamental para extraer el máximo provecho de las posibilidades de un entorno de trabajo adecuado para la ciencia de datos. Las competencias trabajadas en esta asignatura servirán para poder desarrollar proyectos de ciencia de datos en todas las fases del ciclo de vida de los datos, proporcionando soluciones ad-hoc para resolver problemas típicos. Se trata, entonces, de una caja de herramientas que podrá ser usada en muchas situaciones.

Amunt

El perfil profesional que desarrolla esta asignatura es más cercano a un administrador de sistemas, responsable de la infraestructura tecnológica, y también al denominado data engineer, responsable de capturar, manipular y almacenar datos para su posterior análisis. No obstante, se trata de una asignatura que proporciona unas competencias básicas para cualquier científico de datos, sea cual sea su ámbito de actuación.

Amunt

Esta asignatura presupone que el estudiante tiene unos conocimientos básicos de programación estructurada, los cuales son necesarios para la creación de pequeños scripts usados en los ejercicios prácticos, utilizando los constructos básicos.

Como es habitual en el ámbito de la ciencia de datos, se manipularan datos, recursos online y herramientas que solamente se encuentran disponibles en inglés, siendo necesario poder leer y utilizar recursos en esta lengua.

Amunt

En esta asignatura los estudiantes deberán crear entornos virtuales utilizando GNU/Linux para realizar las actividades prácticas propuestas. Por este motivo, es necesario disponer de un ordenador con al menos un procesador dual core de 2GHz, 4Gb de memoria RAM y 25Gb de espacio de disco.

Amunt

Los objetivos que se pretenden asumir mediante esta asignatura son los siguientes:

  • Ser capaces de configurar un entorno de trabajo personal para proyectos del ámbito de la ciencia de datos.
  • Dominar los comandos del sistema operativo GNU/Linux.
  • Conocer una serie de herramientas y utilidades que resuelven problemas típicos relacionados con la obtención, filtro, manipulación y transformación de datos.
  • Desarrollar pequeños scripts para la automatización de tareas típicas.
  • Elaborar proyectos relacionados con la obtención, filtro, manipulación, transformación y presentación de datos utilizando las herramientas propuestas.

Las competencias específicas que se trabajan en esta asignatura son las siguientes:

  • Diseñar y construir aplicaciones analíticas mediante técnicas de desarrollo, integración y reutilización de componentes de software.
  • Aplicar técnicas específicas de captura, tratamiento y análisis de datos estructurados, semi-estructurados y no estructurados.
  • Administrar y gestionar los sistemas operativos y las comunicaciones de los componentes de una red de ordenadores.

Amunt

Los contenidos docentes que se trabajan en esta asignatura son los siguientes:

  • El entorno de trabajo del científico de datos.
  • Fundamentos básicos de sistemas operativos.
  • Instalación, configuración y utilización del sistema operativo GNU/Linux.
  • Creación de scripts mediante bash.
  • Expresiones regulares con sed y grep.
  • El lenguaje awk.
  • Ejemplos: casos de uso. Ejemplos concretos de obtención, filtro, manipulación, transformación y presentación de datos.

Amunt

Espacio de recursos de ciencia de datos Web

Amunt

Como es habitual en las asignaturas donde es necesario desarrollar pequeños programas, es posible que no todos los recursos necesarios para la resolución de las distintas PEC y la Práctica se encuentren directamente en los recursos de aprendizaje propuestos en el aula. Éstos actúan como guías principales que establecen los marcos de trabajo y describen las herramientas más importantes. Sin embargo, es posible que se deban buscar y probar otros recursos en la red. De hecho, buscar, interpretar y aplicar configuraciones de sistemas operativos, comandos de GNU/Linux y bash, expresiones con sed y grep, y programas escritos en awk, debe de ser una competencia que debe de ser adquirida por los estudiantes durante el transcurso de esta asignatura, como parte de su aprendizaje. 

La asignatura también aprovecha el espacio de recursos abiertos de ciencia de datos (http://datascience.recursos.uoc.edu/es/), donde los estudiantes pueden encontrar una selección de herramientas y ejemplos parecidos a los descritos en los materiales docentes, así como otros relacionados.

Amunt

El proceso de evaluación se fundamenta en el trabajo personal de cada estudiante y presupone la autenticidad de la autoría y la originalidad de los ejercicios realizados.

La falta de autenticidad en la autoría o de originalidad de las pruebas de evaluación; la copia o el plagio; el intento fraudulento de obtener un resultado académico mejor; la colaboración, el encubrimiento o el favorecimiento de la copia, o la utilización de material o dispositivos no autorizados durante la evaluación, entre otras, son conductas irregulares que pueden tener consecuencias académicas y disciplinarias graves.

Por un lado, si se detecta alguna de estas conductas irregulares, puede comportar el suspenso (D/0) en las actividades evaluables que se definan en el plan docente - incluidas las pruebas finales - o en la calificación final de la asignatura, ya sea porque se han utilizado materiales o dispositivos no autorizados durante las pruebas, como redes sociales o buscadores de información en internet, porque se han copiado fragmentos de texto de una fuente externa (internet, apuntes, libros, artículos, trabajos o pruebas del resto de estudiantes, etc.) sin la correspondiente citación, o porque se ha practicado cualquier otra conducta irregular.

Por el otro, y de acuerdo con las normativas académicas, las conductas irregulares en la evaluación, además de comportar el suspenso de la asignatura, pueden dar lugar a la incoación de un procedimiento disciplinario y a la aplicación, si procede, de la sanción que corresponda.

La UOC se reserva la potestad de solicitar al estudiante que se identifique o que acredite la autoría de su trabajo a lo largo de todo el proceso de evaluación por los medios que establezca la universidad (síncronos o asíncronos). A estos efectos, la UOC puede exigir al estudiante el uso de un micrófono, una cámara u otras herramientas durante la evaluación y que este se asegure de que funcionan correctamente.

La verificación de los conocimientos para garantizar la autoría de la prueba no implicará en ningún caso una segunda evaluación.

Amunt

Esta asignatura solo puede superarse a partir de la evaluación continua (EC), nota que se combina con una nota de prácticas (Pr) para obtener la nota final de la asignatura. No se prevé hacer ninguna prueba de evaluación final. La fórmula de acreditación de la asignatura es la siguiente: EC + Pr.

 
 

Amunt