MIT 研究人员发布 CompreSSM，在训练阶段即可压缩 AI 模型

这个月，麻省理工学院（MIT）CSAIL 的研究人员发布了 CompreSSM，这是一种在训练过程中压缩人工智能模型的新方法。对于英国企业来说，这项突破实际上切断了“高性能 AI”与“巨额云计算账单”之间的必然联系，让在本地运行强大的定制模型变得切实可行。这项技术在流行架构上的训练速度提升了高达 4 倍，在不损失准确性的情况下，将模型体积缩小到了原来的几分之一。

MIT 将 AI 训练计算量削减了 4 倍

4 月 9 日，MIT 宣布了一项名为 CompreSSM 的新技术，该技术能强迫 AI 模型在学习过程中自行减掉不必要的“赘肉”。

传统上，开发者面临着一个艰难的选择：要么花大钱训练一个庞大的模型，然后再去修剪它；要么训练一个便宜的小模型，但性能却很拉胯。CompreSSM 完全绕过了这种权衡。通过利用控制理论，该系统可以评估模型的哪些部分真正对输出有贡献。关键在于，它能识别出...

MIT 研究人员发布 CompreSSM，在训练阶段即可压缩 AI 模型

MIT 将 AI 训练计算量削减了 4 倍

订阅获取 UK AI 洞察。