Código oficial: IFCT0118Familia: Informática y comunicaciones

IFCT0118 Big Data para Ingenierías

Estructura

Contenido del programa

Fundamentos de Big Data y Procesamiento de Datos

3 secciónes

Conocimiento de los Fundamentos de Big Data

  • Introducción
  • Objetivos
  • Diagrama
  • Evaluación inicial
  • Definición y Conceptos Básicos de Big Data
  • Características de Big Data (las 8 Vs)
  • Principales Paradigmas de Procesamiento en Big Data
  • Introducción a los Sistemas de Almacenamiento Distribuido
  • Podcast
  • Recuerda
  • Tarjetas de estudio
  • Autoevaluación
  • Quiero saber más

Procesamiento de Datos

  • Introducción
  • Objetivos
  • Diagrama
  • Evaluación inicial
  • Introducción a Hadoop y el Sistema de Archivos HDFS
  • Funcionamiento de MapReduce en Hadoop
  • Gestión de Recursos con YARN
  • Ingestión de Datos con Apache Flume y Sqoop
  • Configuración de Seguridad en Hadoop con Kerberos
  • Podcast
  • Recuerda
  • Tarjetas de estudio
  • Autoevaluación
  • Quiero saber más

Conocimiento de Procesos y Herramientas que Favorecen la Eficiencia Energética en el Trabajo con Grandes Volúmenes de Datos

  • Introducción
  • Objetivos
  • Diagrama
  • Evaluación inicial
  • Conocimiento de Procesos y Herramientas que Favorecen la Eficiencia Energética en el Trabajo con Grandes Volúmenes de Datos
  • Podcast
  • Recuerda
  • Tarjetas de estudio
  • Autoevaluación
  • Quiero saber más

Procesamiento Avanzado, Ciencia de Datos y Aprendizaje Automático

2 secciónes

Procesamiento Avanzado con Spark

  • Introducción
  • Objetivos
  • Diagrama
  • Evaluación inicial
  • Conceptos Básicos y Ventajas de Spark
  • Uso de DataFrames y Spark SQL para Análisis de Datos
  • Operaciones con DataFrames y Optimización de Consultas
  • Operaciones con Resilient Distributed Datasets (RDDs)
  • Ejecución de Aplicaciones en Spark y Manejo de Clusters
  • Podcast
  • Recuerda
  • Tarjetas de estudio
  • Autoevaluación
  • Quiero saber más

Uso de la Ciencia de Datos y Machine Learning

  • Introducción
  • Objetivos
  • Diagrama
  • Evaluación inicial
  • Introducción a Spark MLlib y Algoritmos Básicos de Machine Learning
  • Modelado, Evaluación y Validación de Modelos de Datos
  • Librerías y Funciones de MLlib para Procesamiento de Datos
  • Implementación de Pipelines de Machine Learning
  • Podcast
  • Recuerda
  • Tarjetas de estudio
  • Autoevaluación
  • Quiero saber más

Análisis y Procesamiento en Tiempo Real

2 secciónes

Análisis y Almacenamiento de Datos

  • Introducción
  • Objetivos
  • Diagrama
  • Evaluación inicial
  • Introducción a Hive e Impala para Consultas SQL en Hadoop
  • Creación y Gestión de Tablas y Bases de Datos
  • Consultas Avanzadas con HiveQL y Optimización de Impala
  • Análisis de Datos Complejos con Hive y Consultas de Impala
  • Podcast
  • Recuerda
  • Tarjetas de estudio
  • Autoevaluación
  • Quiero saber más

Procesamiento en Tiempo Real

  • Introducción
  • Objetivos
  • Diagrama
  • Evaluación inicial
  • Fundamentos de Spark Streaming y Fuentes de Datos en Tiempo Real
  • Configuración y Ejecución de Flujos de Datos en Spark
  • Integración con Apache Kafka para Ingestión de Datos en Tiempo Real
  • Análisis en Streaming y Actualización en Tiempo Real
  • Podcast
  • Recuerda
  • Tarjetas de estudio
  • Autoevaluación
  • Quiero saber más