Curso de Big Data – Apache Hadoop

Presentación

Clases en vivo: Lunes de 19 A 22 hs.

En los últimos 30 años el mundo de la informática ha experimentado cambios profundos. Han surgido nuevas arquitecturas de aplicaciones, nuevos paradigmas de programación y nuevas herramientas de desarrollo de software. Sin embargo Algo permanece constante: el uso de Bases de Datos Relacionales (RDBMS) como el soporte básico para el almacenamiento y procesamiento de los datos.

La última década ha sido protagonista de una nueva revolución, que si bien no ha desafiado la preponderancia de las bases de datos relacionales, ha demostrado la necesidad de la utilización de nuevos paradigmas para el almacenamiento de datos.

La necesidad de procesar grandes volúmenes de información a partir del uso cotidiano de las redes sociales y dispositivos móviles, es decir, el manejo de volúmenes de datos que salen de lo habitual, tendencia que actualmente denominamos como Big Data, requirió nuevas soluciones tecnológicas. Una de las soluciones que más adopción ha tenido para procesar grandes volúmenes de información es Hadoop.

La adopción de estas tecnologías por las empresas está creciendo, en la medida en que también crece el volumen de datos no estructurados que estas empresas almacenan y gestionan. Consecuencia de esto se está generando un mercado laboral para especialistas en estas áreas, que incluyen desde Administradores de Bases de Datos NoSQL, Administradores de frameworks como Hadoop hasta lo que se conoce como Data Scientists.

Hadoop es un framework de procesamiento distribuido que es Open Source, aunque muchas compañías como Hortonworks o Cloudera han lanzado sus propias distribuciones. Hadoop permite trabajar con miles de nodos y fue inspirada por la necesidad de compañías como Google de escalar horizontalmente.

La fundamentación de la inclusión de este curso se basa en la otorgar a aquellos que lo deseen, la posibilidad de profundizar en conceptos de Hadoop desde el punto de vista de administración de la plataforma. Este curso es necesario para el otros vinculados a la explotación de la información con Hadoop.

Modalidad: Sincronico

group_addEncuentros en vivo
assignment_turned_inAsistencia obligatoria
computerIntercambio en campus virtual

Qué vas a aprender

Objetivo general

  • Usar Hive para hacer joins de sets de datos usando una variedad de técnicas.
  • Usar Hive para ejecutar consultas de tipo SQL para realizar análisis de datos.
  • Explicar y utilizar diferentes formatos de archivo Hive.
  • Usar Hive para explorar como se definen e implementan las tablas Hive y analizar sets de datos.
  • Describir como es generan las tablas Hive.
  • Configurar Hive.
  • Usar Pig para transformar y preparar datos en Hadoop.
  • Configurar un workflowOozie.
  • Usar Flume para tomar datos de streaming en HDFS.
  • Usar Sqoop para transferir datos entre Hadoop y una base de datos.
  • Configurar y hacer troubleshooting de Jobs MapReduce.
  • Describir como se ejecutan los procesos YARN.
  • Describir la arquitectura del file system HDFS.
  • Describir como los archivos se escriben y son accedidos en HDFS.
  • Describir varias herramientas y componentes del ecosistema Hadoop 2.0.
  • Monitorear y administrar un cluster.
  • Instalar y configurar un clusterHadoop.
  • Ejecutar consultas Hive eficientes.

Destinatarios

  • El curso está dirigido a personas con conocimientos en el área de sistemas de información que quieran hacer una inmersión en el mundo de Big Data y Bases y Hadoop aplicando sus conceptos.

Requisitos

  • Recomendable contar estudios al menos iniciales en carreras relacionadas con Sistemas, conocimientos de Unix y conceptuales de sistemas operativos.

Equipo docente

Juan Zaffaroni

Profesor

Ing. Juan Zaffaroni Es egresado de la carrera de Ingeniería en Sistemas de Información de la Universidad Tecnológica Nacional Tiene más de 35 años de experiencia en el área de Gestión de Datos. Es CEO de DBlandIT, empresa que se dedica a Analítica de Datos y Big Data. Profesor desde el año 1991 en la Universidad Tecnológica Nacional – Facultad Regional Buenos Aires, y dicta las materias Gestión de Datos y Bases de Datos NoSQL, pertenecientes a la carrera de grado de Ingeniería en Sistemas de Información. Es Director Académico de la Diplomatura en Arquitecturas de Big Data Aplicadas en Extensión Universitaria de la UTN FRBA.

Juan , Zaffaroni

Lucas Garcia

Coordinador

Mi nombre es Lucas García, soy Ingeniero industrial de UTN BA (2001). Una vez recibido trabajé en Toyota Argentina en Control de la Producción del Abastecimiento de Autopartes Locales. Durante 2005/7 realicé el Posgrado de Dirección Logística integrada en la USAL y a partir de allí, me desempeñé profesionalmente en Shell CAPSA, Siemens, e stando actualmente a cargo de la Gestión operativa de los Almacenes de Upstresm. Realizo Proyectos educativos y Cursos presenciales para la SCEU UTN BA. Soy adjunto de la Cátedra de Planificación y Control de la Producción de la carrera de Ingeniería Industrial (2018) y Coordinador académico de la Tecnicatura Universitaria en Logística UTN BA y Fundación Andreani, iniciada por la Secretaría de Cultura y Extensión universitaria de UTN BA.

Lucas, Garcia

Modalidad de Evaluación y Acreditación:

Estos cursos están diseñados para brindarte una experiencia de aprendizaje con clases en vivo por videoconferencia.


Cada unidad tiene una duración de una semana y se enfoca en contenidos específicos. Accederás a un campus virtual que ofrece material didáctico complementario, clases en vivo semanales y trabajos prácticos.


Es importante que asistas al menos al 75% de las clases en vivo. La evaluación final te permitirá consolidar tus conocimientos. Para aprobar, se requiere cumplir con la asistencia y la aprobación de todas las instancias evaluatorias obligatorias.

Preguntas Frecuentes

Es muy fácil:

  1. Hacé clic en el botón "Inscripción" en la página web de tu curso de interés. Si es la primera vez que estudiás con nosotros, creá tu usuario. Si ya tenés uno, iniciá sesión.
  2. La página te redireccionará al proceso de pago. Si tenés un cupón de descuento, ¡este es el momento de usarlo! Cargá su código en el botón “Tengo un cupón de descuento”.
  3. Luego de operación, el pago puede demorar entre 48 y 72hs en impactar en el sistema. ¡No te preocupes! Cuando se acredite te avisaremos vía correo electrónico. 

En caso que el curso seleccionado cuente con un proceso de admisión, deberás enviar la documentación requerida para ser admitido y luego efectuar la inscripción.

La inscripción de nuestros cursos se mantiene abierta hasta 7 días después de la fecha de inicio.
Seguí los pasos de inscripción y envianos el comprobante de pago a administracion@centrodeelearning.com para que te demos el acceso al aula y puedas comenzar a cursar.

Podés abonar a través de Mercado Pago con tarjeta de débito, crédito o en efectivo.
Si pagás con tarjetas de crédito podrás financiar el pago en 3 o 6 cuotas sin interés, dependiendo del curso. También hay cursos con financiación específica,de tenerla se informa debajo de la presentación

El día de inicio de la cursada te enviaremos un correo electrónico para avisarte que el material ya está disponible en el Campus Virtual. ¡No te desesperes! El correo puede llegar entre las 10 y las 16hs.

A partir de ese momento vas a poder visualizar los contenidos de la primera unidad, el programa de estudio y el cronograma de clases.

Para asegurar la calidad de las clases, algunos cursos pueden tener cupos limitados. Dependiendo del curso, es posible que las vacantes se completen rápido.

¡No te preocupes! Nuestros cursos cuentan con varias fechas de inicio a lo largo del año para que nadie se quede con las ganas de estudiar y certificarse en el Centro de e-Learning UTN BA.