Apache Spark con Java - ¡Manos a la obra! Curso
Aprenda a dividir y cortar datos utilizando la plataforma de big data de próxima generación: Apache Spark.
Lo que aprenderás
Apache Spark con Java - ¡Manos a la obra! Curso
- Utilice el motor de procesamiento de flujo y lote de big data más potente para resolver problemas de big data
- Domine la nueva API Spark Java Datasets para dividir y dividir big data de manera eficiente
- Cree, implemente y ejecute trabajos de Spark en la nube y evalúe el rendimiento en varias configuraciones de hardware
- Optimice los clústeres de chispa para trabajar en big data de manera eficiente y comprender el ajuste del rendimiento
- Transforme datos estructurados y semiestructurados utilizando Spark SQL, Dataframes y Datasets
- Implementar algoritmos populares de aprendizaje automático en Spark, como regresión lineal, regresión logística y agrupación en clústeres de K-medias
Requisitos
- Se requiere cierta experiencia básica en programación Java. Se incluye un curso intensivo sobre lambdas de Java 8
- Necesitará una ordenador personal con conexión a Internet.
- El software necesario para este curso es completamente gratuito y lo guiaré a través de los pasos para instalarlo en su ordenador.
Descripción
¡Recientemente actualizado!
Apache Spark es el motor de procesamiento por lotes y de flujo de próxima generación. Su demanda se ha disparado en los últimos años y tener esta tecnología en su currículum es realmente un cambio de juego. ¡Más de 3000 empresas están utilizando Spark en producción en este momento y la lista está creciendo muy rápidamente! A continuación se muestran algunas de las cosas que aprenderá:
- Como desarrollar Aplicaciones Spark Java utilizando Spark marcos de datos SQL
- Entender cómo Clúster autónomo de Spark trabaja detrás de escena
- Cómo utilizar varias transformaciones para dividir y cortar sus datos en Spark Java
- Cómo marshall / unmarshall Objetos de dominio de Java (pojos) mientras trabaja con Conjuntos de datos de Spark
- Maestría uniones, filtros, agregaciones e ingiera datos de varios tamaños y formatos de archivo (txt, csv, Json, etc.)
- Analizar sobre 18 millones de comentarios del mundo real en Reddit para encontrar las palabras más populares utilizadas
- Desarrollar programas usando Spark Streaming para transmitir archivos de índice bursátil
- Arroyo enchufes de red y mensajes en cola en un clúster de Kafka
- Aprenda a desarrollar los más populares algoritmos de aprendizaje automático utilizando Spark MLlib
- Cubre los algoritmos más populares: Regresión lineal, Regresión logística y Agrupación de K-medias
Desarrollará más de 15 aplicaciones prácticas de Spark Java procesando datos del mundo real y cortándolos de varias maneras utilizando varias técnicas de transformación de datos. Este curso tiene una garantía de devolución de dinero de 30 días. Tendrá acceso a todo el código utilizado en este curso.