Código oficial: IFCT0118Familia: Informática y comunicaciones

IFCT0118 Big Data para ingenierías

Estructura

Contenido del programa

Fundamentos de Big Data y procesamiento de datos

3 secciónes

Conocimiento de los fundamentos de Big Data

  • Introducción
  • Objetivos
  • Diagrama
  • Evaluación inicial
  • Definición y conceptos básicos de Big Data
  • Características de Big Data (las 8 Vs)
  • Principales paradigmas de procesamiento en Big Data
  • Introducción a los sistemas de almacenamiento distribuido
  • Podcast
  • Recuerda
  • Tarjetas de estudio
  • Autoevaluación
  • Quiero saber más

Procesamiento de Datos

  • Introducción
  • Objetivos
  • Diagrama
  • Evaluación inicial
  • Introducción a Hadoop y el sistema de archivos HDFS
  • Funcionamiento de MapReduce en Hadoop
  • Gestión de recursos con YARN
  • Ingestión de datos con Apache Flume y Sqoop
  • Configuración de seguridad en Hadoop con Kerberos
  • Podcast
  • Recuerda
  • Tarjetas de estudio
  • Autoevaluación
  • Quiero saber más

Conocimiento de Procesos y Herramientas que Favorecen la Eficiencia Energética en el Trabajo con Grandes Volúmenes de Datos

  • Introducción
  • Objetivos
  • Diagrama
  • Evaluación inicial
  • Conocimiento de procesos y herramientas que favorecen la eficiencia energética en el trabajo con grandes volúmenes de datos
  • Podcast
  • Recuerda
  • Tarjetas de estudio
  • Autoevaluación
  • Quiero saber más

Procesamiento avanzado, ciencia de datos y aprendizaje automático

2 secciónes

Procesamiento avanzado con Spark

  • Introducción
  • Objetivos
  • Diagrama
  • Evaluación inicial
  • Conceptos básicos y ventajas de Spark
  • Uso de DataFrames y Spark SQL para análisis de datos
  • Operaciones con DataFrames y optimización de consultas
  • Operaciones con Resilient Distributed Datasets (RDDs)
  • Ejecución de aplicaciones en Spark y manejo de clusters
  • Podcast
  • Recuerda
  • Tarjetas de estudio
  • Autoevaluación
  • Quiero saber más

Uso de la ciencia de datos y machine learning

  • Introducción
  • Objetivos
  • Diagrama
  • Evaluación inicial
  • Introducción a Spark MLlib y algoritmos básicos de machine learning
  • Modelado, evaluación y validación de modelos de datos
  • Librerías y funciones de MLlib para procesamiento de datos
  • Implementación de pipelines de machine learning
  • Podcast
  • Recuerda
  • Tarjetas de estudio
  • Autoevaluación
  • Quiero saber más

Análisis y procesamiento en tiempo real

2 secciónes

Análisis y almacenamiento de datos

  • Introducción
  • Objetivos
  • Diagrama
  • Evaluación inicial
  • Introducción a Hive e Impala para consultas SQL en Hadoop
  • Creación y gestión de tablas y bases de datos
  • Consultas avanzadas con HiveQL y optimización de Impala
  • Análisis de datos complejos con Hive y consultas de Impala
  • Podcast
  • Recuerda
  • Tarjetas de estudio
  • Autoevaluación
  • Quiero saber más

Procesamiento en tiempo real

  • Introducción
  • Objetivos
  • Diagrama
  • Evaluación inicial
  • Fundamentos de Spark Streaming y fuentes de datos en tiempo real
  • Configuración y ejecución de flujos de datos en Spark
  • Integración con Apache Kafka para ingestión de datos en tiempo real
  • Análisis en streaming y actualización en tiempo real
  • Podcast
  • Recuerda
  • Tarjetas de estudio
  • Autoevaluación
  • Quiero saber más