Código oficial: IFCT0118Familia: Informática y comunicaciones
IFCT0118 Big Data para Ingenierías
Contenido del programa
Fundamentos de Big Data y Procesamiento de Datos
3 secciónes
Fundamentos de Big Data y Procesamiento de Datos
3 secciónes
Conocimiento de los Fundamentos de Big Data
- Introducción
- Objetivos
- Diagrama
- Evaluación inicial
- Definición y Conceptos Básicos de Big Data
- Características de Big Data (las 8 Vs)
- Principales Paradigmas de Procesamiento en Big Data
- Introducción a los Sistemas de Almacenamiento Distribuido
- Podcast
- Recuerda
- Tarjetas de estudio
- Autoevaluación
- Quiero saber más
Procesamiento de Datos
- Introducción
- Objetivos
- Diagrama
- Evaluación inicial
- Introducción a Hadoop y el Sistema de Archivos HDFS
- Funcionamiento de MapReduce en Hadoop
- Gestión de Recursos con YARN
- Ingestión de Datos con Apache Flume y Sqoop
- Configuración de Seguridad en Hadoop con Kerberos
- Podcast
- Recuerda
- Tarjetas de estudio
- Autoevaluación
- Quiero saber más
Conocimiento de Procesos y Herramientas que Favorecen la Eficiencia Energética en el Trabajo con Grandes Volúmenes de Datos
- Introducción
- Objetivos
- Diagrama
- Evaluación inicial
- Conocimiento de Procesos y Herramientas que Favorecen la Eficiencia Energética en el Trabajo con Grandes Volúmenes de Datos
- Podcast
- Recuerda
- Tarjetas de estudio
- Autoevaluación
- Quiero saber más
Procesamiento Avanzado, Ciencia de Datos y Aprendizaje Automático
2 secciónes
Procesamiento Avanzado, Ciencia de Datos y Aprendizaje Automático
2 secciónes
Procesamiento Avanzado con Spark
- Introducción
- Objetivos
- Diagrama
- Evaluación inicial
- Conceptos Básicos y Ventajas de Spark
- Uso de DataFrames y Spark SQL para Análisis de Datos
- Operaciones con DataFrames y Optimización de Consultas
- Operaciones con Resilient Distributed Datasets (RDDs)
- Ejecución de Aplicaciones en Spark y Manejo de Clusters
- Podcast
- Recuerda
- Tarjetas de estudio
- Autoevaluación
- Quiero saber más
Uso de la Ciencia de Datos y Machine Learning
- Introducción
- Objetivos
- Diagrama
- Evaluación inicial
- Introducción a Spark MLlib y Algoritmos Básicos de Machine Learning
- Modelado, Evaluación y Validación de Modelos de Datos
- Librerías y Funciones de MLlib para Procesamiento de Datos
- Implementación de Pipelines de Machine Learning
- Podcast
- Recuerda
- Tarjetas de estudio
- Autoevaluación
- Quiero saber más
Análisis y Procesamiento en Tiempo Real
2 secciónes
Análisis y Procesamiento en Tiempo Real
2 secciónes
Análisis y Almacenamiento de Datos
- Introducción
- Objetivos
- Diagrama
- Evaluación inicial
- Introducción a Hive e Impala para Consultas SQL en Hadoop
- Creación y Gestión de Tablas y Bases de Datos
- Consultas Avanzadas con HiveQL y Optimización de Impala
- Análisis de Datos Complejos con Hive y Consultas de Impala
- Podcast
- Recuerda
- Tarjetas de estudio
- Autoevaluación
- Quiero saber más
Procesamiento en Tiempo Real
- Introducción
- Objetivos
- Diagrama
- Evaluación inicial
- Fundamentos de Spark Streaming y Fuentes de Datos en Tiempo Real
- Configuración y Ejecución de Flujos de Datos en Spark
- Integración con Apache Kafka para Ingestión de Datos en Tiempo Real
- Análisis en Streaming y Actualización en Tiempo Real
- Podcast
- Recuerda
- Tarjetas de estudio
- Autoevaluación
- Quiero saber más