Código oficial: IFCT0118Familia: Informática y comunicaciones
IFCT0118 Big Data para ingenierías
Contenido del programa
Fundamentos de Big Data y procesamiento de datos
3 secciónes
Fundamentos de Big Data y procesamiento de datos
3 secciónes
Conocimiento de los fundamentos de Big Data
- Introducción
- Objetivos
- Diagrama
- Evaluación inicial
- Definición y conceptos básicos de Big Data
- Características de Big Data (las 8 Vs)
- Principales paradigmas de procesamiento en Big Data
- Introducción a los sistemas de almacenamiento distribuido
- Podcast
- Recuerda
- Tarjetas de estudio
- Autoevaluación
- Quiero saber más
Procesamiento de Datos
- Introducción
- Objetivos
- Diagrama
- Evaluación inicial
- Introducción a Hadoop y el sistema de archivos HDFS
- Funcionamiento de MapReduce en Hadoop
- Gestión de recursos con YARN
- Ingestión de datos con Apache Flume y Sqoop
- Configuración de seguridad en Hadoop con Kerberos
- Podcast
- Recuerda
- Tarjetas de estudio
- Autoevaluación
- Quiero saber más
Conocimiento de Procesos y Herramientas que Favorecen la Eficiencia Energética en el Trabajo con Grandes Volúmenes de Datos
- Introducción
- Objetivos
- Diagrama
- Evaluación inicial
- Conocimiento de procesos y herramientas que favorecen la eficiencia energética en el trabajo con grandes volúmenes de datos
- Podcast
- Recuerda
- Tarjetas de estudio
- Autoevaluación
- Quiero saber más
Procesamiento avanzado, ciencia de datos y aprendizaje automático
2 secciónes
Procesamiento avanzado, ciencia de datos y aprendizaje automático
2 secciónes
Procesamiento avanzado con Spark
- Introducción
- Objetivos
- Diagrama
- Evaluación inicial
- Conceptos básicos y ventajas de Spark
- Uso de DataFrames y Spark SQL para análisis de datos
- Operaciones con DataFrames y optimización de consultas
- Operaciones con Resilient Distributed Datasets (RDDs)
- Ejecución de aplicaciones en Spark y manejo de clusters
- Podcast
- Recuerda
- Tarjetas de estudio
- Autoevaluación
- Quiero saber más
Uso de la ciencia de datos y machine learning
- Introducción
- Objetivos
- Diagrama
- Evaluación inicial
- Introducción a Spark MLlib y algoritmos básicos de machine learning
- Modelado, evaluación y validación de modelos de datos
- Librerías y funciones de MLlib para procesamiento de datos
- Implementación de pipelines de machine learning
- Podcast
- Recuerda
- Tarjetas de estudio
- Autoevaluación
- Quiero saber más
Análisis y procesamiento en tiempo real
2 secciónes
Análisis y procesamiento en tiempo real
2 secciónes
Análisis y almacenamiento de datos
- Introducción
- Objetivos
- Diagrama
- Evaluación inicial
- Introducción a Hive e Impala para consultas SQL en Hadoop
- Creación y gestión de tablas y bases de datos
- Consultas avanzadas con HiveQL y optimización de Impala
- Análisis de datos complejos con Hive y consultas de Impala
- Podcast
- Recuerda
- Tarjetas de estudio
- Autoevaluación
- Quiero saber más
Procesamiento en tiempo real
- Introducción
- Objetivos
- Diagrama
- Evaluación inicial
- Fundamentos de Spark Streaming y fuentes de datos en tiempo real
- Configuración y ejecución de flujos de datos en Spark
- Integración con Apache Kafka para ingestión de datos en tiempo real
- Análisis en streaming y actualización en tiempo real
- Podcast
- Recuerda
- Tarjetas de estudio
- Autoevaluación
- Quiero saber más