Clase magistral de limpieza de datos en Python

05/11/2021

Clase magistral de limpieza de datos en Python
Índice
  1. Clase magistral de limpieza de datos en Python
    1. La guía completa para la limpieza de datos para ingenieros de aprendizaje automático

Clase magistral de limpieza de datos en Python

La guía completa para la limpieza de datos para ingenieros de aprendizaje automático

Lo que aprenderás

Clase magistral de limpieza de datos en Python

  • Aprenderá técnicas avanzadas de imputación de datos y limpieza de datos.
  • Aprenderá a aplicar técnicas de limpieza de datos del mundo real a sus datos.
  • Aprenda técnicas avanzadas de limpieza de datos.
  • Aprenderá a preparar los datos de una manera que evite la fuga de datos y, a su vez, la evaluación incorrecta del modelo.

Requisitos

  • Necesitará una base realmente sólida en Python.
  • Deberá comprender los conceptos básicos del aprendizaje automático.

Descripción

Bienvenido a Clase magistral de limpieza de datos en Python.

Preparación de datos quizas el parte más importante de un proyecto de aprendizaje automático. Es la parte que lleva más tiempo, aunque parece ser el tema menos discutido. La preparación de datos, a veces denominada preprocesamiento de datos, es el acto de transformar los datos sin procesar en una forma apropiada para el modelado.

Los algoritmos de aprendizaje automático requieren que los datos de entrada estén numeradosy la mayoría de las implementaciones de algoritmos mantienen esta expectativa. Por lo tanto, si sus datos contienen tipos de datos y valores que no son números, como etiquetas, deberá convertir los datos en números. Además, algoritmos específicos de aprendizaje automático tener expectativas con respecto a los tipos de datos, la escala, la distribución de probabilidad y las relaciones entre las variables de entrada, y es posible que deba cambiar los datos para cumplir con estas expectativas.

En el curso aprenderás:

  • La importancia de la preparación de datos para proyectos de aprendizaje automático de modelado predictivo.
  • Cómo preparar datos de una manera que evite la fuga de datos y, a su vez, una evaluación incorrecta del modelo.
  • Cómo identificar y manejar problemas con datos desordenados, como valores atípicos y valores perdidos.
  • Aprenda a identificar y eliminar variables de entrada redundantes e irrelevantes con métodos de selección de funciones.
  • Cómo saber qué método de selección de características elegir según los tipos de datos de las variables.
  • Cómo escalar el rango de variables de entrada usando técnicas de normalización y estandarización.
  • Aprenda a codificar variables categóricas como números y variables numéricas como categorías.
  • Cómo transformar la distribución de probabilidad de las variables de entrada.
  • Cómo transformar un conjunto de datos con diferentes tipos de variables y cómo transformar las variables de destino.
  • Aprenda a proyectar variables en un espacio de dimensiones inferiores que capture las relaciones de datos más destacadas.
LEER
El curso completo de escritura independiente en línea: curso de principiante a profesional

Este curso es una guía práctica. Es un libro de jugadas y un libro de trabajo diseñado para que aprenda con la práctica y luego aplique su nuevo conocimiento a la ingeniería de funciones en Python. Para aprovechar al máximo el curso, recomendaría trabajar con todos los ejemplos de cada tutorial. Si miras este curso como una película, obtendrás muy poco de él.

En el espacio aplicado, el aprendizaje automático es programación y la programación es un deporte práctico.

Gracias por su interés en Clase magistral de limpieza de datos en Python.

¡Empecemos!

Más Información

Subir

Este sitio web utiliza cookies para ofrecerle una mejor experiencia de navegación, si continua en navegando consideramos que acepta su uso.