Data Engineering

Inicio de cursada
  20/02/2025
 

Presentación

En un mundo cada vez más digitalizado, los datos se han convertido en un recurso estratégico para las organizaciones. La capacidad de recolectar, unificar y gestionar eficientemente los datos es fundamental para impulsar la ciencia de datos, la inteligencia artificial y la analítica avanzada, y así obtener información valiosa que impulse la toma de decisiones informadas.

En este curso vas a adquirir los conocimientos y habilidades necesarias para ser capaz de aprovechar el potencial de los datos en su máximo esplendor. Vas a aprender las técnicas y herramientas fundamentales para recolectar, limpiar, transformar y almacenar datos de manera efectiva, permitiendo su posterior análisis y aplicación en diversos contextos empresariales. Nos centraremos principalmente en el uso de tecnologías clave, tales como Python y sus librerías, sqlalchemy, requests y pandas, así como en la implementación de PostgreSQL y Apache Kafka.

La importancia de la ingeniería de datos radica en su capacidad para unificar y organizar información de múltiples fuentes, creando un ecosistema de datos confiable y coherente. Esto facilita la implementación de modelos de inteligencia artificial, la generación de insights predictivos y la optimización de procesos empresariales. Al dominar los fundamentos de la ingeniería de datos, vas a estar en condiciones de desempeñar un papel crucial en el crecimiento y éxito de las organizaciones en la era de los datos.

Modalidad: A distancia ágil

play_circle_filledEn vivo o acceso a las grabaciones
descriptionRecursos Multimedia
wifi100% a distancia
record_voice_overAcompañamiento de tutores

Objetivo general

Dominar los conceptos y técnicas de la ingeniería de datos mediante la resolución de desafíos prácticos y el desarrollo progresivo de un trabajo integrador, siendo capaz de realizar la ingesta, almacenamiento y procesamiento de datos por cuenta propia.

Objetivos específicos

  • Conocer las tecnologías y herramientas de la ingeniería de datos.
  • Comprender que es la ingeniería y cuales son sus funciones y responsabiliades.
  • Conocer el uso y la importancia de los datos en las organizaciones mediante el estudio y análisis de casos.
  • Conocer los conceptos y técnicas para el procesamiento de datos en tiempo real mediante el desarrollo de programas en Python y el uso de Apache Kafka.
  • Dominar técnicas de procesamiento de datos mediante el desarrollo de programas en Python.
  • Implementar diferentes modelos de almacenamiento de datos para permitir un análisis eficiente, usando el motor de bases de datos Postgres y formatos de archivos especiales como Parquet.
  • Dominar las técnicas para extraer datos de diferentes tipos de sistemas y estructuras mediante el desarrollo de programas en Python.

Destinatarios

  • El curso va dirigido a estudiantes, profesionales e interesados de áreas de Sistemas, Informática o similares que deseen introducirse y/o especializarse en la ingeniería de datos.

Requisitos

  • Conocimientos básicos de programación: Es importante tener un entendimiento básico de la programación, incluyendo conceptos como variables, estructuras de control (condicionales y bucles) y funciones. Es deseable tener conocimientos en el lenguaje Python, pero no es obligatorio.
  • Conocimientos de SQL. Se necesita ser capaz de realizar consultas SQL para manipular los datos. Esto implica realizar consultas SELECT con condiciones, utilizar funciones de agregación (SUM, COUNT, AVG, etc.), y realizar operaciones de unión (JOIN) entre tablas.
  • Conocimientos sobre bases de datos relacionales. Se necesita comprender conceptos como tablas y relaciones entre tablas.

Equipo docente

Guido Franco

Profesor

Mi nombre es Guido, soy Data Engineer Senior con amplia experiencia en la industria de Oil & Gas. Actualmente, como Owner Architect lidero equipos de ingeniería de datos y me ocupo de la definición, despliegue y evolución de soluciones de Big Data en diferentes proyectos. Además, cuento con dos certificaciones de Microsoft en Cloud Compu ting y Data & Analytics. También, he tomado diversos cursos a nivel internacional en Arquitectura, Ingeniería y Ciencia de Datos.

Guido, Franco
  • Gorelik, A. (2019). The Enterprise Big Data Lake. O’Reilly Media, Inc. https://learning.oreilly.com/library/view/the-enterprise-big/9781491931547/
  • Reis, J., & Housley, M. (2022). Fundamentals of Data Engineering. O’Reilly Media, Inc. https://learning.oreilly.com/library/view/fundamentals-of-data/9781098108298/
  • Crickard, P. (2020). Data Engineering with Python. Packt Publishing. https://learning.oreilly.com/library/view/data-engineering-with/9781839214189/

Metodología De Enseñanza-Aprendizaje:

La modalidad de e - Learning Colaborativo es totalmente mediada por tecnologías a través del Campus Virtual FRBA. Se trata de una modalidad básicamente asincrónica que aprovecha pedagógicamente los recursos de la Web 2.0, con un complemento sincrónico, por medio de la realización de clases en tiempo real, logrando superar de esta forma, la instancia de autoestudio.


El trayecto formativo consta de Módulos; cada uno de ellos está conformado por unidades, las cuales a su vez, integran los contenidos temáticos.


Así, en cada unidad, Usted contará con:

  • Vías de comunicación con el tutor: mensajería interna del Campus Virtual y foros para la presentación de dudas y consultas.
  • Material de estudio curado.
  • Actividades y trabajos integradores de aplicación de los conocimientos adquiridos, individuales y/o grupales.
  • Clase en tiempo real, 2 encuentros por módulo, en el Aula Virtual Sincrónica.

Modalidad de Evaluación y Acreditación:

La evaluación del trayecto formativo comprende una evaluación integradora por módulo y una Evaluación Integradora Final Obligatoria (EFIO), que se basa en la realización por parte del alumno de la entrega de una tarea (consigna específica para su desarrollo) o cuestionario. Dicha evaluación final cuenta con una instancia de recuperatorio, para aquellos participantes que no aprobaron la primera o no la realizaron dentro de las fechas estipuladas por cronograma.


A su vez, se tendrá en cuenta también, para la evaluación:


  • La descarga y lectura de todos los elementos que componen la unidad temática.
  • La entrega y aprobación de todas las actividades y ejercicios que se consignen como obligatorios.
  • La dedicación horaria indicada en cada caso para lograr el máximo rendimiento del estudio.
  • El alumno deberá finalizar la cursada dentro de la duración del trayecto sin excepción. - Terminado el mismo, no podrá entregar ni descargar nada adeudado y deberá cursar nuevamente en un próximo inicio, en caso de desear finalizarlo.

La acreditación del trayecto constará de la Aprobación de lo indicado en la evaluación obligatoria.


La calificación será cualitativa: Bueno, Muy Bueno, Excelente, Sobresaliente, Participó o No Participó.
Las primeras cuatro calificaciones otorgan un certificado de "Aprobación".
Aquellos alumnos que no hayan alcanzado alguna de estas tres calificaciones o no hayan realizado la EFIO, podrán obtener una calificación y certificación de Participación, previa comprobación por parte del Tutor de ciertos criterios de evaluación.