Courses Blog Research Lab AI Letters The Lab Code Bank Interactive 3DKodr Earnest Jobs

Skip to main content

Module 11 - Reinforcement Learning

MDPs, dynamic programming, Q-learning, deep Q-networks, policy gradient methods, and RLHF for language models.