LLM-RL Training–Inference Mismatch Blog

November 23, 2025

A blog post sharing my perspective on training–inference mismatch in reinforcement learning for large language models.