返回新闻
news.categories.ai-trends
MIT 研究人员发布 CompreSSM,在训练阶段即可压缩 AI 模型
Yufan Zheng
创始人 · 前字节跳动 · 北京大学硕士
1 分钟阅读
· 更新于

这个月,麻省理工学院(MIT)CSAIL 的研究人员发布了 CompreSSM,这是一种在训练过程中压缩人工智能模型的新方法。对于英国企业来说,这项突破实际上切断了“高性能 AI”与“巨额云计算账单”之间的必然联系,让在本地运行强大的定制模型变得切实可行。这项技术在流行架构上的训练速度提升了高达 4 倍,在不损失准确性的情况下,将模型体积缩小到了原来的几分之一。
MIT 将 AI 训练计算量削减了 4 倍
4 月 9 日,MIT 宣布了一项名为 CompreSSM 的新技术,该技术能强迫 AI 模型在学习过程中自行减掉不必要的“赘肉”。
传统上,开发者面临着一个艰难的选择:要么花大钱训练一个庞大的模型,然后再去修剪它;要么训练一个便宜的小模型,但性能却很拉胯。CompreSSM 完全绕过了这种权衡。通过利用控制理论,该系统可以评估模型的哪些部分真正对输出有贡献。关键在于,它能识别出...
订阅获取 UK AI 洞察。
针对英国企业的 AI 实战内容 —— 拆解、教程、监管解读。随时取消。
随时取消。