Skip to main content
YUFAN & CO.
返回博客
行业

英国取消了版权数据 AI 训练的“退出”计划

Yufan Zheng
创始人 · 前字节跳动 · 北京大学硕士
1 分钟阅读
· 更新于
Cover illustration for UK scraps opt-out plan for AI training on copyrighted data

英国政府这周干脆利落地废掉了一个备受争议的计划。原本他们打算让 AI 公司用一种“退出制”(opt-out)来随便拿版权作品练模型。对于正在开发或购买 AI 工具的英国中小企业来说,这意味着训练数据背后的法律灰色地带变得更黑了,整个市场正被迫转向严格的授权模式。

这份在 3 月 18 日发布的法定报告正式宣布,政府放弃了科技公司游说已久的“文本和数据挖掘豁免权”。

“退出制”彻底凉了

2026 年 3 月 18 日,政府发布了关于 AI 与版权的最终报告,确认不会引入新的文本和数据挖掘豁免条款。

以前,官员们倾向于一种模式:只要版权方没明确说“不准用”,AI 开发者就能随便爬数据。但在上议院的一份报告出炉以及创意产业的大规模抵制后,这个计划彻底泡汤了。

政府承认,现行的英国版权法很可能禁止未经授权的通用 AI 训练。部长们不打算立新法,而是打算盯着现有的授权市场,再多搜集点证据。这让那些依赖人类生成数据的 AI 开发者收到了一个明确信号:想用就得给钱。现在的英国创意产业正集体转向“授权优先”的 AI 训练模式,就像我们已经看到的 OpenAI 和各大新闻出版商之间动辄几百万英镑的交易一样。

为什么这会改变你的数据策略

如果你经营着一家 50 人的代理商或中型软件公司,你可能会觉得版权之争那是 Microsoft 和 Getty Images 这种大厂的事。那你就错了。

“退出制”豁免的终结意味着,你爬取的、存储的、或者用来微调本地模型的任何私有数据,都带有即时的法律风险。

上议院说得很清楚:为了训练 AI 而复制数据,在现行法律下属于“复制行为”,而不是一种受保护的“学习形式”。我觉得这是一个必要的纠偏,但对规模较小的 AI 开发者来说,环境变得非常残酷。如果你在为客户定制 AI 工具,你再也不能想当然地认为公开网页上的数据就能随便拿来用。你要么拿到明确的授权,要么就得在合成数据集上跑你的系统。 对于购买现成 AI 工具的人来说,成本可能会上涨。供应商肯定会把这些刚性支出的数据授权费转嫁给终端用户。

你需要检查的三件事

  1. 审计你的微调流程。 如果你的技术团队正在爬取英国网站来训练本地模型,赶紧叫停。你需要明确的许可或商业授权才能安全地使用这些数据。
  2. 问问供应商的数据来源。 给你的主要 AI 软件供应商发封邮件,问问他们是怎么处理英国版权合规问题的。如果他们解释不清自己的授权策略,那他们就是你业务中的合规风险。
  3. 关注创意内容交易中心(Creative Content Exchange)。 政府计划在 2026 年夏天试点这个数据授权中心。盯着它,这可能是你未来项目中干净、合法训练数据的一个潜在来源。

订阅获取 UK AI 洞察。

针对英国企业的 AI 实战内容 —— 拆解、教程、监管解读。随时取消。

随时取消。