Inteligencia artificial avanzada: aprendizaje por refuerzo profundo en el sitio del curso de Python
La guía completa para dominar la inteligencia artificial mediante el aprendizaje profundo y las redes neuronales
Lo que aprenderás
Inteligencia artificial avanzada: aprendizaje por refuerzo profundo en el sitio del curso de Python
- Cree varios agentes de aprendizaje profundo (incluidos DQN y A3C)
- Aplique una variedad de algoritmos avanzados de aprendizaje por refuerzo a cualquier problema
- Q-Learning con redes neuronales profundas
- Métodos de gradiente de políticas con redes neuronales
- Aprendizaje por refuerzo con redes RBF
- Utilice redes neuronales convolucionales con Deep Q-Learning
Requisitos
- Conocer los conceptos básicos del aprendizaje por refuerzo, MDP, Programación dinámica, Monte Carlo, TD Learning
- Las matemáticas de nivel universitario son útiles
- Experimente la creación de modelos de aprendizaje automático en Python y Numpy
- Sepa cómo crear ANN y CNN con Theano o Tensorflow
Descripción
Este curso trata sobre la aplicación de aprendizaje profundo y Redes neuronales para aprendizaje reforzado.
El aprendizaje por refuerzo existe desde los años 70, pero nada de esto ha sido posible hasta ahora.
El mundo está cambiando a un ritmo muy rápido.
Hemos visto que el aprendizaje por refuerzo es un tipo de aprendizaje automático completamente diferente al aprendizaje supervisado y no supervisado.
A diferencia de los algoritmos de aprendizaje supervisados y no supervisados, los agentes de aprendizaje por refuerzo tienen un ímpetu: quieren alcanzar una meta.
Esta es una perspectiva tan fascinante que incluso puede hacer que el aprendizaje automático supervisado / no supervisado y "Ciencia de los datos”Parece aburrido en retrospectiva. ¿Por qué entrenar una red neuronal para aprender sobre los datos en una base de datos, cuando se puede entrenar una red neuronal para interactuar con el mundo real?
Si bien el aprendizaje por refuerzo profundo y la inteligencia artificial tienen muchos potenciales, también conllevan un gran riesgo.
Parte de la motivación detrás de OpenAI es el riesgo existencial que la IA representa para los humanos. Creen que la colaboración abierta es una de las claves para mitigar ese riesgo.
Una de las mejores cosas de OpenAI es que tienen una plataforma llamada Gimnasio OpenAI, que usaremos mucho en este curso.
Permite a cualquier persona, en cualquier parte del mundo, capacitar a sus agentes de aprendizaje por refuerzo en entornos estándar.
En este curso, nos basaremos en lo que hicimos en el último curso al trabajar con entornos más complejos, específicamente, los proporcionados por OpenAI Gym:
- Carrito
- Coche de montaña
- Juegos de Atari
Para formar agentes de aprendizaje eficaces, necesitaremos nuevas técnicas.
Gracias por leer, ¡nos vemos en clase!
Requisitos previos sugeridos:
- Las matemáticas de nivel universitario son útiles (cálculo, probabilidad)
- Programación orientada a objetos
- Codificación Python: if / else, bucles, listas, dictados, conjuntos
- Codificación Numpy: operaciones matriciales y vectoriales
- Regresión lineal
- Descenso de gradiente
- Sepa cómo crear ANN y CNN en Theano o TensorFlow
- Procesos de decisión de Markov (MDP)
- Saber cómo implementar programación dinámica, Monte Carlo y aprendizaje de diferencias temporales para resolver MDP
CONSEJOS (para completar el curso):
- Míralo en 2x.
- Toma notas escritas a mano. Esto aumentará drásticamente su capacidad para retener la información.
- Escribe las ecuaciones. Si no lo hace, le garantizo que se verá como un galimatías.
- Haga muchas preguntas en el panel de discusión. ¡Mientras más, mejor!
- Tenga en cuenta que la mayoría de los ejercicios le llevarán días o semanas completar.
- Escriba el código usted mismo, no se limite a sentarse y mirar mi código.
¿EN QUÉ ORDEN DEBO TOMAR TUS CURSOS ?:
- Consulte la conferencia "¿En qué orden debo tomar sus cursos?" (disponible en el Apéndice de cualquiera de mis cursos, incluido el curso gratuito de Numpy)
Inteligencia artificial avanzada: aprendizaje por refuerzo profundo en el sitio del curso de Python
Contenido de: https://www.udemy.com/course/deep-reinforcement-learning-in-python/