News | Xihuai Wang's Page

2026 1 entry

Jan 13, 2026Milestone
I have successfully defended my Ph.D. thesis and graduated from Shanghai Jiao Tong University! 🎉

Dec 2, 2025Writing
A blog post sharing my perspective on KL estimators in reinforcement learning.
- English Version | 中文版本 | 知乎 | 青稞 AI 公众号
Nov 23, 2025Writing
A blog post sharing my perspective on training–inference mismatch in reinforcement learning for large language models.
- English Version | 中文版本 | 知乎 | 青稞 AI 公众号
May 16, 2025Paper
Our paper Leveraging Dual Process Theory in Language Agent Framework for Real-time Simultaneous Human-AI Collaboration has been accepted to ACL 2025!
- 机器之心公众号

Sep 26, 2024Paper
Our work about zero-shot coordination evaluation ZSC-Eval is accepted by NeurIPS 2024 Dataset and Benchmark Track!

Aug 8, 2023Talk
Give a talk about cooperative multi-agent reinforcement learning (Coordinate Agents vis Policy Optimization) at RLChina
- BiliBili 视频
Mar 25, 2023Paper
Our work about policy optimization in cooperative multi-agent scenarios Order Matters: Agent-by-agent Policy Optimization is accepted by ICLR 2023!