美国开发新型训练方法提升AI大语言模型训练效率
来源:中国国际科技合作网 时间:2026-05-29 11:23

资讯编号:2026T-0174

  麻省理工学院研究团队开发出一种名为“驯服长尾”(TLT)的新型训练方法,通过巧妙利用计算资源的“闲置时间”,显著提升了AI大语言模型训练效率。传统的大模型强化学习训练过程中,由于各处理器处理查询的长度不一,导致部分算力在等待中被浪费。研究团队利用这些闲置算力,同步训练一个轻量级的“草稿模型”来预测主模型的输出,再由主模型进行快速验证。这种“异步协作”模式打破了计算瓶颈。该方法可使训练速度提高70%至210%,不仅能降低先进AI的开发成本,还将大幅提升能源利用效率。

  本文摘自国外相关研究报道,文章内容不代表本网站观点和立场,仅供参考。

附件下载

扫一扫在手机上查看当前页面

相关链接