Ir al contenido principal
InicioPython

programa

Aprendizaje por Refuerzo en Python

Actualizado 1/2025
Domina los fundamentos del aprendizaje por refuerzo (RL) para crear modelos que puedan navegar por entornos complejos del mundo real y entrenar LLMs.
Comienza El Programa Gratis

Incluido conPremium or Teams

PythonMachine learning12 h3,466

Crea Tu Cuenta Gratuita

o

Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.
Group

¿Formar a 2 o más personas?

Probar DataCamp for Business

Preferido por estudiantes en miles de empresas

Descripción del programa

Aprendizaje por Refuerzo en Python

Domina los fundamentos del aprendizaje por refuerzo (RL) y descubre cómo construir modelos para navegar por entornos complejos que suelen encontrarse en robótica y videojuegos.Si eres nuevo en el aprendizaje por refuerzo o quieres especializarte en el aprendizaje por refuerzo como rama del aprendizaje automático, éste es un lugar ideal para empezar.Empezarás aprendiendo los conceptos básicos del aprendizaje por refuerzo, como los procesos de decisión de Markov, los equilibrios exploración/explotación y los algoritmos de programación dinámica. Aprenderás a aplicar Q-learning, SARSA y otros métodos para navegar por cordilleras y lagos helados desde la biblioteca del Gimnasio.Fusionarás el aprendizaje profundo y el aprendizaje por refuerzo y descubrirás el aprendizaje por refuerzo profundo, que puede utilizarse para entrenar agentes que naveguen por entornos muy complejos con poca supervisión.Por el camino, aplicarás estas técnicas para abordar proyectos del mundo real, como la optimización de rutas de taxi y la simulación de operaciones bursátiles.Con estas herramientas de aprendizaje por refuerzo a mano, estás preparado para empezar a abordar una nueva y emocionante aplicación del aprendizaje por refuerzo: el aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF). El RLHF se puede utilizar para mejorar los resultados del LLM entrenando la respuesta humana a sus respuestas.¡Comienza hoy mismo tu viaje por el aprendizaje reforzado!

Requisitos previos

No hay requisitos previos para este programa
  • Course

    1

    Reinforcement Learning with Gymnasium in Python

    Start your reinforcement learning journey! Learn how agents can learn to solve environments through interactions.

  • Project

    Material adicional

    Taxi Route Optimization with Reinforcement Learning

    Solve the Taxi-v3 environment using Q-learning, ensuring efficient AI-driven transportation.

Aprendizaje por Refuerzo en Python
3 Cursos
Programa
completo

Obtener certificado de logros

Añade esta certificación a tu perfil de LinkedIn o a tu currículum.
Compártelo en redes sociales y en tu evaluación de desempeño.

Incluido conPremium or Teams

Inscríbete Ahora

¡Únete a 18 millones de estudiantes y empieza Aprendizaje por Refuerzo en Python hoy mismo!

Crea Tu Cuenta Gratuita

o

Al continuar, aceptas nuestros Términos de uso, nuestra Política de privacidad y que tus datos se almacenen en los EE. UU.