Contenidos
Ajuste de Apache Spark: curso de recetas de procesamiento de Big Data de gran alcance
Descubra los secretos menos conocidos del potente procesamiento de big data con Spark y Kafka
Lo que aprenderás
Optimización de Apache Spark: curso de recetas de procesamiento de Big Data de gran alcance
- Cómo lograr una base sólida en las tecnologías más poderosas y versátiles involucradas en la transmisión de datos: Apache Spark y Apache Kafka
- Forme una arquitectura sólida y limpia para una canalización de transmisión de datos
- Formas de implementar las herramientas correctas para darle vida a su arquitectura de transmisión de datos
- Cómo crear canalizaciones de procesamiento sólidas probando trabajos de Apache Spark
- Aprenda a crear programas Spark altamente concurrentes aprovechando la inmutabilidad
- Cómo resolver problemas repetidos aprovechando la API GraphX
- Cómo resolver problemas de cálculo de larga duración aprovechando la evaluación diferida en Spark
- Consejos para evitar pérdidas de memoria al comprender la administración de la memoria interna de Apache Spark
- Solucionar problemas de canalizaciones en tiempo real escritas en Spark Streaming
Requisitos
- Para retomar este curso, no es necesario ser un experto en Spark. Los clientes deben estar familiarizados con Java o Scala.
Descripción
Descripción general de la ruta de aprendizaje en video
Una ruta de aprendizaje es un curso especialmente diseñado que reúne dos o más temas diferentes que lo llevan a lograr un objetivo final. Se piensa mucho en la selección de los activos para una ruta de aprendizaje, y esto se hace a través de una comprensión completa de los requisitos para lograr un objetivo.
Hoy en día, las organizaciones tienen dificultades para trabajar con grandes conjuntos de datos. Aquí es donde entran en juego la transmisión de datos y Spark.
Comenzando con un enfoque paso a paso, se sentirá cómodo usando Spark y aprenderá cómo implementar algunas técnicas prácticas y probadas para mejorar aspectos particulares de la programación y la administración en Apache Spark. Podrás realizar tareas y sacar el máximo partido a tus bases de datos mucho más rápido.
¡Las soluciones sencillas y prácticas proporcionadas le permitirán volver a la acción en muy poco tiempo!
Al final del curso, estará bien versado en el uso de Spark en sus proyectos diarios.
Características clave
- Desde la arquitectura de planos hasta la solución de código completa, este curso trata todos los aspectos importantes involucrados en la arquitectura y el desarrollo de una canalización de transmisión de datos.
- Pruebe los trabajos de Spark utilizando la unidad, la integración y las técnicas de extremo a extremo para hacer que su canal de datos sea sólido y a prueba de balas.
- Resuelva varios problemas dolorosos, como trabajos de ejecución lenta que afectan el rendimiento de su aplicación.
Biografías del autor
- Anghel Leonard actualmente es un arquitecto jefe de Java. Es miembro de Java EE Guardians con más de 20 años de experiencia. Ha pasado la mayor parte de su carrera diseñando sistemas distribuidos. Aquí también está el autor de varios libros, un orador y un gran fanático del trabajo con datos.
- Tomasz Lelek es ingeniero de software, y programa principalmente en Java y Scala. Ha estado trabajando con las API Spark y ML durante los últimos 5 años con experiencia en producción en el procesamiento de petabytes de datos. Recientemente fue ponente en conferencias en Polonia, Confitura y JDD (Java Developers Day), y en Krakow Scala User Group. También ha realizado una sesión de codificación en vivo en la Conferencia Geecon.