分布式系统研究组
Distributed Systems Group

实验室合作成果荣登科协T1期刊封面,短评获Nature刊发

近日,实验室与中科院计算所合作论文“Pipe-RLHF: 计算模式感知的RLHF并行加速框架”,获中国科协T1级期刊《计算机科学与发展》最新一期封面推荐。同时,合作的AI治理通信短评“Tighter Regulation Is Needed for AI Companions”被《Nature》最新一期正式刊发,体现了团队在人工智能技术研究领域的国内外影响力。

Pipe-RLHF是面向强化学习人类反馈(RLHF)训练范式的新型并行加速框架,创新性地提出计算模式感知的自适应并行策略,突破传统RLHF训练中阶段串行的效率瓶颈。通过异步PPO算法深度挖掘阶段间并行性,该框架在保证模型性能的前提下显著提升训练效率。相较于现有方法,Pipe-RLHF最高可实现3.7倍的加速比,充分验证了该框架的有效性和优越性.。

同期发表于《Nature》的短评指出,当前基于大模型的AI交互式应用虽然能够提供情感支持和陪伴服务,但潜藏着隐私泄露、内容安全和情感操控等风险。这些隐患通常不易察觉,根源在于开发者通过收集和利用用户敏感情感数据来达成商业目的,亟需建立更完善的预防性监管机制。

这两项成果的同步发表,标志着实验室在大模型系统优化和大模型AI社会治理方面取得重要进展。实验室团队将继续推动技术创新与社会价值的深度融合,为人工智能领域的可持续发展贡献力量。

  • Pipe-RLHF: 计算模式感知的RLHF 并行加速框架, 计算机研究与发展, 2025. DOI: 10.7544/issn1000-1239.202550127
  • Tighter regulation is needed for AI companions, Nature, 2025. DOI: 10.1038/d41586-025-01906-2
《计算机科学与发展》期刊封面
Nature期刊标志