英国政府这周干脆利落地废掉了一个备受争议的计划。原本他们打算让 AI 公司用一种“退出制”(opt-out)来随便拿版权作品练模型。对于正在开发或购买 AI 工具的英国中小企业来说,这意味着训练数据背后的法律灰色地带变得更黑了,整个市场正被迫转向严格的授权模式。
这份在 3 月 18 日发布的法定报告正式宣布,政府放弃了科技公司游说已久的“文本和数据挖掘豁免权”。
“退出制”彻底凉了
2026 年 3 月 18 日,政府发布了关于 AI 与版权的最终报告,确认不会引入新的文本和数据挖掘豁免条款。
以前,官员们倾向于一种模式:只要版权方没明确说“不准用”,AI 开发者就能随便爬数据。但在上议院的一份报告出炉以及创意产业的大规模抵制后,这个计划彻底泡汤了。
政府承认,现行的英国版权法很可能禁止未经授权的通用 AI 训练。部长们不打算立新法,而是打算盯着现有的授权市场,再多搜集点证据。这让那些依赖人类生成数据的 AI 开发者收到了一个明确信号:想用就得给钱。现在的英国创意产业正集体转向“授权优先”的 AI 训练模式,就像我们已经看到的 OpenAI 和各大新闻出版商之间动辄几百万英镑的交易一样。
为什么这会改变你的数据策略
如果你经营着一家 50 人的代理商或中型软件公司,你可能会觉得版权之争那是 Microsoft 和 Getty Images 这种大厂的事。那你就错了。
“退出制”豁免的终结意味着,你爬取的、存储的、或者用来微调本地模型的任何私有数据,都带有即时的法律风险。
上议院说得很清楚:为了训练 AI 而复制数据,在现行法律下属于“复制行为”,而不是一种受保护的“学习形式”。我觉得这是一个必要的纠偏,但对规模较小的 AI 开发者来说,环境变得非常残酷。如果你在为客户定制 AI 工具,你再也不能想当然地认为公开网页上的数据就能随便拿来用。你要么拿到明确的授权,要么就得在合成数据集上跑你的系统。 对于购买现成 AI 工具的人来说,成本可能会上涨。供应商肯定会把这些刚性支出的数据授权费转嫁给终端用户。
你需要检查的三件事
- 审计你的微调流程。 如果你的技术团队正在爬取英国网站来训练本地模型,赶紧叫停。你需要明确的许可或商业授权才能安全地使用这些数据。
- 问问供应商的数据来源。 给你的主要 AI 软件供应商发封邮件,问问他们是怎么处理英国版权合规问题的。如果他们解释不清自己的授权策略,那他们就是你业务中的合规风险。
- 关注创意内容交易中心(Creative Content Exchange)。 政府计划在 2026 年夏天试点这个数据授权中心。盯着它,这可能是你未来项目中干净、合法训练数据的一个潜在来源。
订阅获取 UK AI 洞察。
针对英国企业的 AI 实战内容 —— 拆解、教程、监管解读。随时取消。
随时取消。
