Homepage - Heng Zhou

Warning

Problem: The current name of your GitHub Pages repository ("") does not match the recommended repository name for your site ("").
Solution: Please consider renaming the repository to "", so that your site can be accessed directly at "http://". However, if the current repository name is intended, you can ignore this message by removing "{% include widgets/debug_repo_name.html %}" in index.html.

Selected Publications (view all )

The landscape of agentic reinforcement learning for llms: A survey

Guibin Zhang*, Hejia Geng*, Xiaohang Yu*, Zhenfei Yin^#, Zaibin Zhang, Zelin Tan, Heng Zhou, Zhongzhi Li, Xiangyuan Xue, Yijiang Li, Yifan Zhou, Yang Chen, Chen Zhang, Yutao Fan, Zihu Wang, Songtao Huang, Yue Liao, Hongru Wang, Mengyue Yang, Heng Ji, Michael Littman, Jun Wang, Shuicheng Yan, Philip Torr, Lei Bai^# (* equal contribution, ^# corresponding author)

preprint

[Paper] [Code]

The landscape of agentic reinforcement learning for llms: A survey

preprint

[Paper] [Code]

SSRL: Self-Search Reinforcement Learning

Yuchen Fan*, Kaiyan Zhang*, Heng Zhou*, Yuxin Zuo, Yanxu Chen, Yu Fu, Xinwei Long, Xuekai Zhu, Che Jiang, Yuchen Zhang, Li Kang, Gang Chen, Cheng Huang, Zhizhou He, Bingning Wang, Lei Bai^#, Ning Ding^#, Bowen Zhou^# (* equal contribution, ^# corresponding author)

Under review.

[Paper] [Code]

SSRL: Self-Search Reinforcement Learning

Under review.

[Paper] [Code]

VIKI-R: Coordinating Embodied Multi-Agent Cooperation via Reinforcement Learning

Li Kang*, Xiufeng Song*, Heng Zhou*, Yiran Qin^#, Jie Yang, Xiaohong Liu, Philip Torr, Lei Bai^#, Zhenfei Yin^# (* equal contribution, ^# corresponding author)

Annual Conference on Neural Information Processing Systems (NeurIPS) 2025

[Paper] [Project Page] [Code] [Dataset]

VIKI-R: Coordinating Embodied Multi-Agent Cooperation via Reinforcement Learning

Li Kang*, Xiufeng Song*, Heng Zhou*, Yiran Qin^#, Jie Yang, Xiaohong Liu, Philip Torr, Lei Bai^#, Zhenfei Yin^# (* equal contribution, ^# corresponding author)

Annual Conference on Neural Information Processing Systems (NeurIPS) 2025

[Paper] [Project Page] [Code] [Dataset]

ReSo: A Reward-driven Self-organizing LLM-based Multi-Agent System for Reasoning Tasks

Heng Zhou*, Hejia Geng*, Xiangyuan Xue, Li Kang, Yiran Qin, Zhiyong Wang, Zhenfei Yin^#, Lei Bai^# (* equal contribution, ^# corresponding author)

EMNLP 2025 main Oral paper, SAC Highlight Award, (Top 1%)

[Paper] [Code]

ReSo: A Reward-driven Self-organizing LLM-based Multi-Agent System for Reasoning Tasks

Heng Zhou*, Hejia Geng*, Xiangyuan Xue, Li Kang, Yiran Qin, Zhiyong Wang, Zhenfei Yin^#, Lei Bai^# (* equal contribution, ^# corresponding author)

EMNLP 2025 main Oral paper, SAC Highlight Award, (Top 1%)

[Paper] [Code]

Warning

Action required

Education

Experience

Honors & Awards

Selected Publications (view all )

The landscape of agentic reinforcement learning for llms: A survey

The landscape of agentic reinforcement learning for llms: A survey

SSRL: Self-Search Reinforcement Learning

SSRL: Self-Search Reinforcement Learning

VIKI-R: Coordinating Embodied Multi-Agent Cooperation via Reinforcement Learning

VIKI-R: Coordinating Embodied Multi-Agent Cooperation via Reinforcement Learning

ReSo: A Reward-driven Self-organizing LLM-based Multi-Agent System for Reasoning Tasks

ReSo: A Reward-driven Self-organizing LLM-based Multi-Agent System for Reasoning Tasks

All publications