Ciencia de datos: detección de fraudes con tarjetas de crédito: creación de modelos

14/12/2021

Ciencia de datos deteccion de fraudes con tarjetas de credito
Índice
  1. Ciencia de datos: detección de fraudes con tarjetas de crédito: creación de modelos
    1. Proyecto: Un proyecto práctico de ciencia de datos sobre detección de fraudes con tarjetas de crédito que utiliza diferentes técnicas de muestreo y creación de modelos para descubrir quién está tratando de robar dinero a las personas.

Ciencia de datos: detección de fraudes con tarjetas de crédito: creación de modelos

Proyecto: Un proyecto práctico de ciencia de datos sobre detección de fraudes con tarjetas de crédito que utiliza diferentes técnicas de muestreo y creación de modelos para descubrir quién está tratando de robar dinero a las personas.

Lo que vas a aprender

Ciencia de datos: detección de fraudes con tarjetas de crédito: creación de modelos

  • Analizar y comprender los datos.
  • Técnicas de preparación de datos para su uso.
  • Con los modelos de regresión logística, KNN, árbol, bosque aleatorio, XGBoost y SVM, puede crear un modelo.
  • KFolds que se repiten y KFolds que se han agrupado.
  • SMOTE y ADASYN son tres sobremuestreos aleatorios y todos funcionan.
  • Métricas para clasificación.
  • En este caso, vamos a hablar sobre cómo

Requisitos

  • Conocimiento de Python

Descripción

En este curso, cubriré cómo desarrollar un modelo de detección de fraude de tarjetas de crédito para categorizar una transacción como fraude o legítima con una precisión muy alta utilizando diferentes modelos de aprendizaje automático. Este es un proyecto práctico en el que le enseñaré paso a paso el proceso de creación y evaluación de un modelo de aprendizaje automático.

Este curso lo guiará a través de la exploración y comprensión de datos iniciales, el análisis de datos, la preparación de datos, la construcción de modelos y la evaluación. Exploraremos los conceptos RepeatedKFold, StratifiedKFold, Random Oversampler, SMOTE, ADASYN y luego usaremos múltiples algoritmos ML para crear nuestro modelo y finalmente nos enfocaremos en uno que funcione mejor en el conjunto de datos dado.

Para que le resulte más fácil ver lo que se cubrirá en el curso, lo he dividido en las tareas siguientes.

Tarea 1: Colocar los paquetes.

Es la Tarea 2: Importar las bibliotecas.

Tarea 3: Obtener los datos de la fuente.

Tarea 4: Conocer los datos

La Tarea 5: Verificar la distribución de la variable objetivo en su clase es el siguiente paso.

Tarea 6: Encuentra correlaciones y haz un mapa de calor.

Tarea 7: Asegurarse de que las funciones funcionen bien.

La tarea 8: Entrene el grupo de prueba

Tarea 9: Ver cómo se distribuye una variable en un gráfico.

Matriz de confusión, Informe de clasificación y AUC-ROC son las cosas que debe conocer en la Tarea 10.

creó una función común para trazar la matriz de confusión para las tareas 11 y 12.

¿Qué necesita saber sobre la regresión logística? KNN? ¿Árbol? Bosque aleatorio? XGBoost?

Tarea 13: Creé una función única que podría usarse para ajustar y predecir un modelo de regresión logística.

Tarea 14: Creé una función única que podría usarse para ajustar y predecir un modelo KNN.

Tarea 15: Creé una función única que podría usarse para ajustar y predecir un modelo de árbol.

LEER
¡Linux para principiantes absolutos! - curso online

Tarea 16: Creé una función única que podría usarse para ajustar y predecir un modelo de bosque aleatorio.

Tarea 17: Creé una función única que podría usarse para ajustar y predecir un modelo XGBoost.

La Tarea 18: Creé una función única que podría usarse para ajustar y predecir un modelo SVM.

Ciencia de datos: detección de fraudes con tarjetas de crédito: creación de modelos

Lo que necesita saber sobre Kfold repetido y Kfold apilado en la Tarea 19.

Tarea 20: Uso de RepeatedKFold y Model Evaluation para realizar una validación cruzada para la Tarea 20

Tarea 21: Uso de StratifiedKFold y Model Evaluation para realizar la validación cruzada y la evaluación del modelo.

La Tarea 22: Continúe con el modelo que ha mostrado los mejores resultados hasta ahora, hasta ahora.

Tarea 23: Sobremuestreo aleatorio, SMOTE y ADASYN son algunas de las cosas que debe conocer.

24: Realización de sobremuestreo con muestreo aleatorio y uso de StratifiedKFold para la validación cruzada y la evaluación del modelo que creó.

Tarea 25: Sobremuestreo con SMOTE y evaluación de los modelos que hizo.

26: Sobremuestreo con ADASYN y mirando el modelo que hizo

Tarea 27: Ajustar los hiperparámetros, o

Tarea 28: Encuentra las funciones más importantes.

Tarea 29: Haz una conclusión final.

Si quiere trabajar en el siglo XXI, necesita saber cómo hacer análisis de datos y hacer modelos. Asegúrese de tomar el curso ahora, y estará mucho más informado sobre el aprendizaje automático en solo unas horas, ¡así que no espere!

Etiquetassoluciones antifraude detección de fraude bancario detección de fraude de big data detección de fraude de tarjetas detección de fraude de datos detección de fraude detección de fraude detección de fraude financiero análisis de fraude análisis de fraude detección de fraude detección de fraude algoritmos de detección de fraude análisis de detección de fraude detección y prevención de fraude detección de fraude en la banca métodos de detección de fraude servicios de detección de fraude sistema de detección de fraude técnicas de detección de fraude identificación de fraude gestión de fraude modelado de fraude modelos de fraude monitoreo de fraude monitoreo de fraude en bancos prevención de fraude prevención y detección de fraude definición de prevención de fraude solución de prevención de fraude soluciones de prevención de fraude sistemas de prevención de fraude herramientas de prevención de fraude solución de fraude sistema de fraude sistemas de fraude cómo detectar fraude cómo prevenir fraudes identificar fraudes detección de fraude en línea prevenir el fraude prevenir el fraude detección de fraude en la web detección de fraude en el sitio web detector de fraude en el sitio web qué es la protección contra el fraude

.

Más Información

Subir

Este sitio web utiliza cookies para ofrecerle una mejor experiencia de navegación, si continua en navegando consideramos que acepta su uso.