Aprendizaje por Refuerzo en Python

Actualizado 5/2026

Domina los fundamentos del aprendizaje por refuerzo (RL) para crear modelos que puedan navegar por entornos complejos del mundo real y entrenar LLMs.

Descripción del programa

Aprendizaje por Refuerzo en Python

Domina los fundamentos del aprendizaje por refuerzo (RL) y descubre cómo construir modelos para navegar por entornos complejos que suelen encontrarse en robótica y videojuegos.Si eres nuevo en el aprendizaje por refuerzo o quieres especializarte en el aprendizaje por refuerzo como rama del aprendizaje automático, éste es un lugar ideal para empezar.Empezarás aprendiendo los conceptos básicos del aprendizaje por refuerzo, como los procesos de decisión de Markov, los equilibrios exploración/explotación y los algoritmos de programación dinámica. Aprenderás a aplicar Q-learning, SARSA y otros métodos para navegar por cordilleras y lagos helados desde la biblioteca del Gimnasio.Fusionarás el aprendizaje profundo y el aprendizaje por refuerzo y descubrirás el aprendizaje por refuerzo profundo, que puede utilizarse para entrenar agentes que naveguen por entornos muy complejos con poca supervisión.Por el camino, aplicarás estas técnicas para abordar proyectos del mundo real, como la optimización de rutas de taxi y la simulación de operaciones bursátiles.Con estas herramientas de aprendizaje por refuerzo a mano, estás preparado para empezar a abordar una nueva y emocionante aplicación del aprendizaje por refuerzo: el aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF). El RLHF se puede utilizar para mejorar los resultados del LLM entrenando la respuesta humana a sus respuestas.¡Comienza hoy mismo tu viaje por el aprendizaje reforzado!

Requisitos previos

No hay requisitos previos para este programa

Course
1
Reinforcement Learning con Gymnasium en Python
¡Empieza tu viaje en el aprendizaje por refuerzo! Aprende cómo los agentes pueden aprender a resolver entornos a través de interacciones.
Project
Material adicional
Taxi Route Optimization with Reinforcement Learning
Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.
Course
3
Aprendizaje profundo por refuerzo en Python
Aprende y utiliza potentes algoritmos de Aprendizaje Profundo por Refuerzo, incluyendo técnicas de refinamiento y optimización.
Project
Material adicional
Stock Trading Simulation with Gymnasium
Train a simple reinforcement learning agent in stock trading simulation.
Course
5
Reinforcement Learning from Human Feedback (RLHF)
Aprende a crear modelos de IA generativa que reflejen los valores humanos mientras adquieres experiencia práctica con LLM avanzados.

Aprendizaje por Refuerzo en Python

3 Cursos

Programa
completo

Obtener certificado de logros

Añade esta certificación a tu perfil de LinkedIn o a tu currículum.
Compártelo en redes sociales y en tu evaluación de desempeño.Inscríbete ahora

Aprendizaje por Refuerzo en Python

¿Formando un equipo?

Descripción del programa

Aprendizaje por Refuerzo en Python

Requisitos previos

Reinforcement Learning con Gymnasium en Python

Taxi Route Optimization with Reinforcement Learning

Aprendizaje profundo por refuerzo en Python

Stock Trading Simulation with Gymnasium

Reinforcement Learning from Human Feedback (RLHF)

Obtener certificado de logros

¡Únete a 19 millones de estudiantes y empieza Aprendizaje por Refuerzo en Python hoy mismo!

Desarrolla tus habilidades de datos con la aplicación móvil de DataCamp

Descripción del programa

Aprendizaje por Refuerzo en Python

Obtener certificado de logros

¡Únete a .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 millones de estudiantes y empieza Aprendizaje por Refuerzo en Python hoy mismo!

Crea tu cuenta gratuita

Desarrolla tus habilidades de datos con la aplicación móvil de DataCamp

¡Únete a 19 millones de estudiantes y empieza Aprendizaje por Refuerzo en Python hoy mismo!