Curso de Big Data con Apache Spark | INESEM Business School

100% Online

200 horas

Flexibilidad horaria

Presentación
Temario
Metodología
Titulación

Descripción

¿A quién va dirigido?

Este Curso de Big Data con Apache Spark está diseñado para profesionales y estudiantes de informática, ciencias de datos, ingeniería de software y disciplinas relacionadas que deseen adquirir habilidades avanzadas en Big Data y Apache Spark. También es adecuado para gerentes y ejecutivos/as para impulsar la toma de decisiones estratégicas en sus organizaciones.

Objetivos

- Comprender la distinción entre Big Data y Thick Data. - Dominar técnicas de Data Mining y aprendizaje automático. - Configurar y utilizar el ecosistema Hadoop. - Desarrollar habilidades en programación funcional con Apache Spark. - Utilizar DataFrames y Datasets para manipulación estructurada de datos. - Implementar streaming de datos con Spark y Kafka. - Aplicar algoritmos de machine learning y análisis de grafos con Spark.

Salidas Profesionales

Al completar este Curso de Big Data con Apache Spark podrás trabajar en ámbitos como ciencia de datos, ingeniería Big Data, análisis de datos, arquitectura de soluciones en la nube, consultoría de Business Intelligence, entre otros roles especializados. Las empresas buscan habilidades en estas herramientas para impulsar la innovación y obtener una ventaja competitiva en el mercado.

Temario del Curso de Big Data con Apache Spark

UNIDAD DIDÁCTICA 1. LA REVOLUCIÓN DE LOS DATOS MASIVOS: BIG DATA Y THICK DATA

¿Qué es Big Data?
¿Y Thick Data? ¿Cuál es el matiz para diferenciar ambos términos?
El gran auge del big data
La importancia de almacenar y extraer información
¿Cuál es el papel de las fuentes de datos?
Soluciones novedosas gracias a la selección de datos
Naturaleza de las fuentes de datos Big Data

UNIDAD DIDÁCTICA 2. MINERÍA DE DATOS O DATA MINING Y EL APRENDIZAJE AUTOMÁTICO

Introducción a la minería de datos y el aprendizaje automático
Proceso KDD
Modelos y Técnicas de Data Mining
Áreas de aplicación
Minería de Textos y Web Mining
Data mining y marketing

UNIDAD DIDÁCTICA 3. ECOSISTEMA HADOOP

¿Qué es Hadoop? Relación con Big Data
Instalación y configuración de infraestructura y ecosistema Hadoop
Sistema de archivos HDFS
MapReduce con Hadoop
Apache Hive
Apache Hue
Apache Spark

UNIDAD DIDÁCTICA 4. FUNDAMENTOS DE APACHE SPARK

Introducción a Apache Spark: arquitectura y componentes
RDDs (Resilient Distributed Datasets): API básico, operaciones y persistencia
Transformaciones y acciones en RDDs
Programación funcional en Spark: Scala y Python
Entornos de desarrollo para Spark: Spark Standalone, YARN, Kubernetes

UNIDAD DIDÁCTICA 5. API DE DATASETS EN SPARK

DataFrames y Datasets: API estructurada para datos
Lectura y escritura de DataFrames desde diferentes fuentes
Transformaciones en DataFrames: filtros, joins, agregaciones, etc
Funciones SQL en Spark: Spark SQL
Optimización de queries en Spark

UNIDAD DIDÁCTICA 6. STREAMING DE DATOS CON SPARK

Introducción al streaming de datos: conceptos clave
Spark Streaming: API DStream y receptores
Micro-batches y ventanas en streaming
Integración de Spark Streaming con Kafka
Aplicaciones de streaming: análisis de tweets, detección de fraudes, etc

UNIDAD DIDÁCTICA 7. MACHINE LEARNING CON SPARK

Introducción al Machine Learning: tipos de aprendizaje
MLlib: biblioteca de Machine Learning en Spark
Regresión lineal y logística con Spark
Clasificación de texto con Spark
Clustering con Spark: K-Means, K-NN
Algoritmos avanzados: Random Forest, Gradient Boosting

UNIDAD DIDÁCTICA 8. GRAPHS Y ALGORITMOS DE REDES

Introducción a GraphX: API para grafos en Spark
Representación de grafos en GraphX
Algoritmos básicos de grafos: PageRank, Shortest Path
Análisis de comunidades en grafos
Aplicaciones de GraphX: recomendación de productos, análisis de redes sociales

UNIDAD DIDÁCTICA 9. BIG DATA EN LA NUBE

Introducción a la computación en la nube: AWS, Azure, GCP
Servicios de Big Data en la nube: EMR, Dataproc, BigQuery
Implementación de Spark en la nube
Seguridad y escalabilidad en la nube

Metodología

EDUCA LXP se basa en 6 pilares

Item

Distintiva

EDUCA EDTECH Group es proveedor de conocimiento. Respaldado por el expertise de nuestras instituciones educativas, el alumnado consigue una formación relevante y avalada por un sello de calidad como es el grupo EDUCA EDTECH.

Realista

La metodología EDUCA LXP prescinde de conocimientos excesivamente teóricos o de métodos prácticos poco eficientes. La combinación de contenidos en constante actualización y el seguimiento personalizado durante el proceso educativo hacen de EDUCA LXP una metodología única.

Student First

La metodología EDUCA LXP y la formación del grupo EDUCA EDTECH conciben al estudiante como el centro de la experiencia educativa, nutriéndose de su retroalimentación. Su feedback es nuestro motor del cambio.

Inteligencia Artificial

La personalización en el aprendizaje no sería posible sin una combinación precisa entre experiencia académica e investigación tecnológica, así como la Inteligencia Artificial. Por eso contamos con herramientas IA de desarrollo propio, adaptadas a cada institución educativa del grupo.

Profesionales en activo

Nuestro equipo de profesionales docentes, además de ser especialistas en su sector, cuentan con una formación específica en el manejo de herramientas tecnológicas que conforman el ecosistema EDUCA EDTECH.

Timeless Learning

La formación debe ser una experiencia de vida, concibiendo el e-learning como una excelente solución para los desafíos de la educación convencional. Entendemos el aprendizaje como un acompañamiento continuo del estudiante en cada momento de su vida.

Titulación del Curso de Big Data con Apache Spark

"Titulación Expedida y Avalada por el Instituto Europeo de Estudios Empresariales. """"""""Enseñanza No Oficial y No Conducente a la Obtención de un Título con Carácter Oficial o Certificado de Profesionalidad."

Titulacion de INESEM

INESEM Business School se ocupa también de la gestión de la Apostilla de la Haya, previa demanda del estudiante. Este sello garantiza la autenticidad de la firma del título en los 113 países suscritos al Convenio de la Haya sin necesidad de otra autenticación. El coste de esta gestión es de 65 euros. Si deseas más información contacta con nosotros en el 958 050 205 y resolveremos todas tus dudas.

Solicita información

Nombre * Apellidos Teléfono * Correo electrónico * País * ¿En qué te podemos ayudar?

Explora nuestras Áreas Formativas

Construye tu carrera profesional

Descubre nuestro amplio Catálogo Formativo, incluye programas de Cursos Superior, Expertos, Master Profesionales y Master Universitarios en las diferentes Áreas Formativas para impulsar tu carrera profesional.

Diseño y Artes Gráficas

Educación y Sociedad

Gestión Empresarial

Gestión Integrada

Informática y TIC

Ingeniería y Edificación

Curso de Big Data con Apache Spark

100% Online

200 horas

Flexibilidad horaria

Descargar PDF

Nombre * Apellidos Teléfono * Correo electrónico * País * ¿En qué te podemos ayudar?

Nombre * Apellidos Teléfono * Correo electrónico * País * ¿En qué te podemos ayudar?