D-ARL: A Distribution-Matched Asynchronous Reinforcement Learning Framework for Language Reasoning

May 2026

Yinqi Bai, Tong Xialiang, Jie Wang, Hongyu Liu, ngdi Pan, Jiashuo Li, Zehao Wang, Jianye Hao, Mingxuan Yuan, Feng Wu

Type

Conference paper

Publication

Forty-Third International Conference on Machine Learning