Publications - Heng Zhou

2026

LFQA-E: Carefully Benchmarking Long-form QA Evaluation

Yuchen Fan, Chen Lin, Xin Zhong, Shuo Zhang, Heng Zhou, Yuchen Zhang, Mingyu Liang, Chengxing Xie, Ermo Hua, Gang Chen, Zhizhou He, Cheng Huang, Ning Ding, Bowen Zhou

International Conference on Learning Representations (ICLR) 2026

[Paper]

LFQA-E: Carefully Benchmarking Long-form QA Evaluation

Yuchen Fan, Chen Lin, Xin Zhong, Shuo Zhang, Heng Zhou, Yuchen Zhang, Mingyu Liang, Chengxing Xie, Ermo Hua, Gang Chen, Zhizhou He, Cheng Huang, Ning Ding, Bowen Zhou

International Conference on Learning Representations (ICLR) 2026

[Paper]

Ego to World: Collaborative Spatial Reasoning in Embodied Systems via Reinforcement Learning

Heng Zhou, Li Kang, Yiran Qin, Xiufeng Song, Ao Yu, Zilu Zhang, Haoming Song, Kaixin Xu, Yuchen Fan, Dongzhan Zhou, Xiaohong Liu, Ruimao Zhang, Philip Torr, Lei Bai^#, Zhenfei Yin^# (^# corresponding author)

preprint

Ego to World: Collaborative Spatial Reasoning in Embodied Systems via Reinforcement Learning

preprint

Reading ≠ Seeing: Diagnosing and Closing the Typography Gap in Vision-Language Models

Heng Zhou, Ao Yu, Li Kang, Yuchen Fan, Yutao Fan, Xiufeng Song, Hejia Geng, Yiran Qin

preprint

[Paper]

Reading ≠ Seeing: Diagnosing and Closing the Typography Gap in Vision-Language Models

Heng Zhou, Ao Yu, Li Kang, Yuchen Fan, Yutao Fan, Xiufeng Song, Hejia Geng, Yiran Qin

preprint

[Paper]

DIVA: Discrete Diffusion Vision-Language-Action Models for Parallelized Action Generation

Xiufeng Song, Yiran Qin, Yan Tai, Li Kang, Heng Zhou, Siqi Luo, Jiwen Yu, Ling Yang, Philip Torr, Lei Bai

preprint

DIVA: Discrete Diffusion Vision-Language-Action Models for Parallelized Action Generation

Xiufeng Song, Yiran Qin, Yan Tai, Li Kang, Heng Zhou, Siqi Luo, Jiwen Yu, Ling Yang, Philip Torr, Lei Bai

preprint

From Perception to Action: An Interactive Benchmark for Vision Reasoning

Yuhao Wu, Maojia Song, Yihuai Lan, Lei Wang, Zhiqiang Hu, Yao Xiao, Heng Zhou, Weihua Zheng, Dylan Raharja, Soujanya Poria, Roy Ka-Wei Lee

preprint

[Paper]

From Perception to Action: An Interactive Benchmark for Vision Reasoning

Yuhao Wu, Maojia Song, Yihuai Lan, Lei Wang, Zhiqiang Hu, Yao Xiao, Heng Zhou, Weihua Zheng, Dylan Raharja, Soujanya Poria, Roy Ka-Wei Lee

preprint

[Paper]

RoboMonster: Compositional Generalization of Heterogeneous Multi-End Effector Embodied Agents

Yiran Qin, Zhemeng Zhang, Heng Zhou, Li Kang, Bruno NY Chen, Ximeng Meng, Xiufeng Song, Jiahua Ma, Zhenfei Yin, Xiaohong Liu

preprint

RoboMonster: Compositional Generalization of Heterogeneous Multi-End Effector Embodied Agents

Yiran Qin, Zhemeng Zhang, Heng Zhou, Li Kang, Bruno NY Chen, Ximeng Meng, Xiufeng Song, Jiahua Ma, Zhenfei Yin, Xiaohong Liu

preprint

Building Scalable Real-World Robot Data Generation via Compositional Simulation

Yiran Qin, Jiahua Ma, Li Kang, Wenzhan Li, Xiufeng Song, Heng Zhou, Jiwen Yu, Zhenfei Yin, Xihui Liu, Philip Torr, Yilun Du, Ruimao Zhang

preprint

Building Scalable Real-World Robot Data Generation via Compositional Simulation

Yiran Qin, Jiahua Ma, Li Kang, Wenzhan Li, Xiufeng Song, Heng Zhou, Jiwen Yu, Zhenfei Yin, Xihui Liu, Philip Torr, Yilun Du, Ruimao Zhang

preprint

State Rank Dynamics in Linear Attention LLMs

Ao Sun, Hongtao Zhang, Heng Zhou, Yixuan Ma, Yiran Qin, Tongrui Su, Yan Liu, Zhanyu Ma, Jun Xu, Jiuchong Gao, Jinghua Hao, Renqing He

preprint

[Paper]

State Rank Dynamics in Linear Attention LLMs

Ao Sun, Hongtao Zhang, Heng Zhou, Yixuan Ma, Yiran Qin, Tongrui Su, Yan Liu, Zhanyu Ma, Jun Xu, Jiuchong Gao, Jinghua Hao, Renqing He

preprint

[Paper]

Advances and Innovations in the Multi-Agent Robotic System (MARS) Challenge

Li Kang*, Heng Zhou*, Xiufeng Song*, Rui Li*, Bruno NY Chen, Ziye Wang, Ximeng Meng, Stone Tao, Yiran Qin, Xiaohong Liu, Ruimao Zhang, Lei Bai, Yilun Du, Hao Su, Philip Torr, Zhenfei Yin, Ruihao Gong, Yejun Zeng, Fengjun Zhong, Shenghao Jin, Jinyang Guo, Xianglong Liu, Xiaojun Jia, Tianqi Shan, Wenqi Ren, Simeng Qin, Jialing Yang, Xiaoyu Ma, Tianxing Chen, Zixuan Li, Zijian Cai, Yan Qin, Yusen Qin, Qiangyu Chen, Kaixuan Wang, Zhaoming Han, Yao Mu, Ping Luo, Yuanqi Yao, Haoming Song, Jan-Nico Zaech, Fabien Despinoy, Danda Pani Paudel, Luc Van Gool (* equal contribution)

preprint

[Paper]

Advances and Innovations in the Multi-Agent Robotic System (MARS) Challenge

preprint

[Paper]

Toward Efficient Agents: Memory, Tool Learning, and Planning

Xiaofang Yang*, Lijun Li*, Heng Zhou*, Tong Zhu*, Xiaoye Qu, Yuchen Fan, Qianshan Wei, Rui Ye, Li Kang, Yiran Qin, Zhiqiang Kou, Daizong Liu, Qi Li, Ning Ding, Siheng Chen, Jing Shao (* equal contribution)

preprint

[Paper]

Toward Efficient Agents: Memory, Tool Learning, and Planning

preprint

[Paper]

2025

LiveSearchBench: An Automatically Constructed Benchmark for Retrieval and Reasoning over Dynamic Knowledge

Heng Zhou, Ao Yu, Yuchen Fan, Jianing Shi, Li Kang, Hejia Geng, Yongting Zhang, Yutao Fan, Yuhao Wu, Tiancheng He, Yiran Qin, Lei Bai^#, Zhenfei Yin^# (^# corresponding author)

preprint

[Paper]

LiveSearchBench: An Automatically Constructed Benchmark for Retrieval and Reasoning over Dynamic Knowledge

Heng Zhou, Ao Yu, Yuchen Fan, Jianing Shi, Li Kang, Hejia Geng, Yongting Zhang, Yutao Fan, Yuhao Wu, Tiancheng He, Yiran Qin, Lei Bai^#, Zhenfei Yin^# (^# corresponding author)

Ying Zhu, Heng Zhou, Rui Su, Peiqin Zhuang, Lei Bai^# (^# corresponding author)

preprint

[Paper]

VIKI-R: Coordinating Embodied Multi-Agent Cooperation via Reinforcement Learning

Li Kang*, Xiufeng Song*, Heng Zhou*, Yiran Qin^#, Jie Yang, Xiaohong Liu, Philip Torr, Lei Bai^#, Zhenfei Yin^# (* equal contribution, ^# corresponding author)

Annual Conference on Neural Information Processing Systems (NeurIPS) 2025

[Paper] [Project Page] [Code] [Dataset]

VIKI-R: Coordinating Embodied Multi-Agent Cooperation via Reinforcement Learning

Li Kang*, Xiufeng Song*, Heng Zhou*, Yiran Qin^#, Jie Yang, Xiaohong Liu, Philip Torr, Lei Bai^#, Zhenfei Yin^# (* equal contribution, ^# corresponding author)

Annual Conference on Neural Information Processing Systems (NeurIPS) 2025

[Paper] [Project Page] [Code] [Dataset]

ReSo: A Reward-driven Self-organizing LLM-based Multi-Agent System for Reasoning Tasks

Heng Zhou*, Hejia Geng*, Xiangyuan Xue, Li Kang, Yiran Qin, Zhiyong Wang, Zhenfei Yin^#, Lei Bai^# (* equal contribution, ^# corresponding author)

EMNLP 2025 main Oral paper, SAC Highlight Award, (Top 1%)

[Paper] [Code]

ReSo: A Reward-driven Self-organizing LLM-based Multi-Agent System for Reasoning Tasks

Heng Zhou*, Hejia Geng*, Xiangyuan Xue, Li Kang, Yiran Qin, Zhiyong Wang, Zhenfei Yin^#, Lei Bai^# (* equal contribution, ^# corresponding author)

EMNLP 2025 main Oral paper, SAC Highlight Award, (Top 1%)

[Paper] [Code]

2024

SS3DM: Benchmarking Street-View Surface Reconstruction with a Synthetic 3D Mesh Dataset

Yubin Hu*, Kairui Wen*, Heng Zhou, Xiaoyang Guo, Yong-Jin Liu^# (* equal contribution, ^# corresponding author)

Annual Conference on Neural Information Processing Systems (NeurIPS)

[Paper] [Code]

SS3DM: Benchmarking Street-View Surface Reconstruction with a Synthetic 3D Mesh Dataset

Yubin Hu*, Kairui Wen*, Heng Zhou, Xiaoyang Guo, Yong-Jin Liu^# (* equal contribution, ^# corresponding author)

Annual Conference on Neural Information Processing Systems (NeurIPS)

[Paper] [Code]