Contenidos
Inteligencia artificial: aprendizaje por refuerzo en el sitio del curso de Python
Guía completa de inteligencia artificial, preparación para el aprendizaje por refuerzo profundo con aplicaciones de negociación de acciones
Lo que aprenderás
Inteligencia artificial: aprendizaje por refuerzo en el sitio del curso de Python
- Aplicar métodos de aprendizaje automático supervisado basados en gradientes al aprendizaje por refuerzo
- Comprender el aprendizaje por refuerzo a nivel técnico.
- Comprender la relación entre el aprendizaje por refuerzo y la psicología.
- Implementar 17 algoritmos de aprendizaje por refuerzo diferentes
Requisitos
- Cálculo (derivados)
- Probabilidad / Modelos de Markov
- Numpy, Matplotlib
- Experiencia de ave beneficiosa con al menos algunos métodos de aprendizaje automático supervisados
- Descenso de gradiente
- Buenas habilidades de programación orientada a objetos
Descripción
Cuando la gente habla de inteligencia artificial, por lo general no se refieren a supervisados y no supervisados aprendizaje automático.
Aprendizaje reforzado se ha vuelto popular recientemente por hacer todo eso y más.
Muy parecido aprendizaje profundo, gran parte de la teoría se descubrió en los años 70 y 80, pero no ha sido hasta hace poco que hemos podido observar de primera mano los sorprendentes resultados que son posibles.
En 2016 vimos De Google AlphaGo venció al campeón mundial en Go.
Vimos IA jugando videojuegos como Doom y Super Mario.
Los coches autónomos han empezado a circular por carreteras reales con otros conductores e incluso llevan pasajeros (Uber), todo sin ayuda humana.
Si eso suena increíble, prepárese para el futuro porque la ley de los rendimientos acelerados dicta que este progreso solo seguirá aumentando exponencialmente.
Aprender sobre el aprendizaje automático supervisado y no supervisado no es poca cosa. Hasta la fecha, tengo más de DIECISÉIS (¡16!) Cursos solo sobre esos temas.
Y, sin embargo, el aprendizaje por refuerzo abre un mundo completamente nuevo. Como aprenderá en este curso, el paradigma del aprendizaje por refuerzo es más diferente del aprendizaje supervisado y no supervisado que entre ellos.
Ha llevado a conocimientos nuevos y sorprendentes tanto en psicología del comportamiento como en neurociencia. Como aprenderá en este curso, existen muchos procesos análogos cuando se trata de enseñar a un agente y enseñar a un animal o incluso a un humano.
Es lo más parecido que tenemos hasta ahora a una verdadera inteligencia artificial general.
- El problema de los bandidos armados múltiples y el dilema explorar-explotar
- Formas de calcular medias y promedios móviles y su relación con el descenso del gradiente estocástico
- Procesos de decisión de Markov (MDP)
- Programación dinámica
- Monte Carlo
- Aprendizaje de diferencia temporal (TD) (Q-Learning y SARSA)
- Métodos de aproximación (es decir, cómo conectar una red neuronal profunda u otro modelo diferenciable en su algoritmo RL)
- Proyecto: Aplicar Q-Learning para construir un bot de comercio de acciones
Si está listo para asumir un nuevo desafío y aprender sobre técnicas de inteligencia artificial que nunca antes había visto en el aprendizaje automático supervisado tradicional, el aprendizaje automático no supervisado o incluso el aprendizaje profundo, este curso es para usted.
Requisitos previos sugeridos:
- Cálculo
- Probabilidad
- Programación orientada a objetos
- Codificación Python: if / else, bucles, listas, dictados, conjuntos
- Codificación Numpy: operaciones matriciales y vectoriales
- Regresión lineal
- Descenso de gradiente
CONSEJOS (para completar el curso):
- Míralo en 2x.
- Toma notas escritas a mano. Esto aumentará drásticamente su capacidad para retener la información.
- Escribe las ecuaciones. Si no lo hace, le garantizo que se verá como un galimatías.
- Haga muchas preguntas en el panel de discusión. ¡Mientras más, mejor!
- Tenga en cuenta que la mayoría de los ejercicios le llevarán días o semanas completar.
- Escriba el código usted mismo, no se limite a sentarse y mirar mi código.
¿EN QUÉ ORDEN DEBO TOMAR TUS CURSOS ?:
- Consulte la conferencia "¿En qué orden debo tomar sus cursos?" (disponible en el Apéndice de cualquiera de mis cursos, incluido el curso gratuito de Numpy)
Inteligencia artificial: aprendizaje por refuerzo en el sitio del curso de Python
Contenido de: https://www.udemy.com/course/artificial-intelligence-reinforcement-learning-in-python/