清华蚂蚁联合开源AR
6月5日音讯(报导 :李楠)近来 ,清华清华蚂蚁联合研制的蚂蚁全异步强化学习练习体系AReaL-boba。2。联合(AReaL v0.3 )正式宣告开源 。开源据了解,清华这一体系全面完结了异步强化学习练习,蚂蚁彻底解耦模型生成与练习,联合功能作用不变的开源前提下 ,练习速度对比上一版别最高提高2.77倍 ,清华GPU资源利用率大幅优化。蚂蚁研讨人员运用这一体系在Qwen3 系列模型上做强化学习练习,联合完结8B、开源14B 模型在 LiveCodeBench,清华 Codeforce, Codecontest 等benchmark上到达SOTA水准 。 此外,蚂蚁 AReaL-boba。联合2 。还原生支撑多轮智能体强化学习练习