Skip to main content
YUFAN & CO.
返回博客
blog.categories.guides

别再交那 £15k 的“打字税”了:聊聊真正的业务流程自动化

Yufan Zheng
创始人 · 前字节跳动 · 北京大学硕士
1 分钟阅读
· 更新于
Cover illustration for Moving Beyond the £15k Typing Tax: Real Operational Automation

你坐在办公室里,盯着一张 £15,000 的年度软件账单。你的 IT 供应商刚给公司那 50 号人全开了 Microsoft Copilot 或者 Google Workspace Gemini。大家都参加了强制培训,也都知道怎么对着屏幕角落里那个小对话框发指令(prompt)。

但实际工作中,啥也没变。

你的运营经理还是得手动把邮件里的数据搬到 Xero。你的销售每天还得花两个小时更新 HubSpot 里的记录。你的收件箱确实更满了,只不过全是 LLM 生成的那种又长、又客气、但全是废话的邮件。

你以为买了个业务自动化工具,结果只买了个高级版的打字助手。

这就是现在大多数中型企业的现状。你付着高昂的 AI 订阅费,却没拿到任何实际的业务产出。活儿还是得干那么久,只是看起来稍微高级了点儿。

这 £15,000 的「打字税」

所谓的「打字税」,就是你买了企业级 AI 账号,结果它只能帮你写写文档,根本没法让业务流程自动化。你给 Copilot 或 Gemini 掏了溢价,指望效率大爆发,结果它只是让你草拟文案快了点。

之所以会这样,是因为这些工具是长在你的全家桶办公软件里的。它们被困在 Word、Excel、Google Docs 和 Sheets 里面。它们的设计初衷就是帮人写文档、调 PPT 格式或者总结会议纪要。它们压根就不是为了在后台帮你跑业务而设计的。

一家 50 人的中小企业,业务卡壳通常不是因为员工打字太慢。你之所以难受,是因为数据被困在六个不同的系统里。PDF 发票躺在 Outlook 里,客户记录埋在 Pipedrive 里,账单明细锁在 Xero 里。

给每个用户每月花大约 £25 买 Microsoft Copilot (https://www.microsoft.com/en-us/microsoft-365/blog/2024/01/15/bringing-the-full-power-of-copilot-to-more-people-and-businesses/) 或 Google Workspace Gemini (https://workspace.google.com/blog/product-announcements/gemini-for-google-workspace),根本填不上这种结构性的鸿沟。它只是让那些手动活儿显得现代了一点。你的员工还是得打开邮件,读一下摘要,然后把数字一个个敲进去。

人工瓶颈纹丝不动。你只是每个月交一笔钱,让这个瓶颈看起来更有「生产力」而已。

为什么原生 AI 推行不下去

原生 AI 方案之所以失败,是因为这些办公助手需要人坐在键盘前,手动触发每一个动作。大多数中小企业试图通过买 50 个 Copilot 账号来修补烂掉的业务流程,觉得 AI 能自己搞清楚那些乱七八糟的内部手续。

这事儿压根跑不通。我给你拆解一下它到底在哪儿断掉了:Copilot 能读完 Outlook 里一长串邮件并写个得体的回复,但它没法自动从那封邮件里提取自定义的采购订单号,去跟 Airtable 数据库比对,然后再悄悄地把 Xero 里的发票给审了。

AI 被死死地困在了用户界面里。

根据我的经验,一个 50 人的团队每个月大概要处理 800 封供应商邮件。如果你用 Gemini 去总结这些邮件,你的财务助理还是得读摘要,打开 QuickBooks,然后手动输入数字。你只是加了一个显摆的 AI 环节,却没减掉一丁点儿人力。

这就是对办公 AI 最大的误解。原生工具完全依赖聊天,你每次都得求它干活。真正的业务 AI 靠的是 webhook 和后台处理。事情一发生就自动触发,解析数据,更新数据库,全程不需要任何人去点那个按钮。

买 Copilot 来搞定业务流程,就像是你明明需要一个自动化的 Excel 宏,却去买了个跑得更快的计算器。

「无头工作流」方案

「无头工作流」方案

无头自动化架构:用后台 webhook 取代聊天框,将结构化数据直接传进会计软件。

「无头工作流」(Headless workflow)方案是把你的沟通渠道直接连到独立的 LLM 和核心数据库上,完全不依赖用户界面。你直接绕过 Copilot 或 Gemini 的聊天框,搭一个在后台默默运行的系统。

实际操作起来是这样的:一封邮件发到了财务专用邮箱,附件里带着供应商发票。我们不希望人去读这封邮件,也不希望人去发指令让 AI 读这封邮件。

n8n 的 webhook 在收到邮件的一瞬间就会触发。它下载 PDF 附件,直接扔给 Claude API。这里我们用 Claude 3.5 Sonnet,因为它的视觉模型在解析非结构化文档方面目前强得多。

我们给 Claude 一个严格的 JSON 模式(schema)。它会提取供应商名称、发票日期、明细项、税额和总额。接着,n8n 工作流拿着这些结构化的 JSON 数据去查 Xero,看看系统里有没有这个供应商。

如果有,就创建一个草稿账单。如果总额对得上 HubSpot 里存的原始采购订单,它就自动批准这笔账单。只有当 webhook 标记了异常情况时,财务助理才需要介入。这才是用真正的、可衡量的自动化取代了那 £15,000 的打字税。

搭建这么一套专门的应付账款流程,大概需要两到三周的集中开发。成本大概在 £6,000 到 £12,000 之间,主要取决于你现在的 Xero 设得有多乱。后续的持续成本只是你的 n8n 托管费和 Claude API 的原始使用费,通常一个月也就 £80 左右。

这套方案主要的翻车点是数据提取时的「幻觉」。解决办法是在 JSON 模式里强制执行严格的数据类型,并在 n8n 内部加一个硬核校验环节。

如果提取出的税额加净额不等于总额,工作流会立刻停掉,并在 Slack 频道里弹窗叫人来人工审核。你把人从数据搬运层彻底抽离了出来。

「无头模式」在哪儿会失灵

如果你的输入需要主观的人为判断,或者依赖于那些没有 API 接口的老旧本地软件,无头模式就玩不转了。如果 AI 物理上根本碰不到底层数据,你就没法搞自动化。

如果你的物流团队收到的送货单是手写的,而且扫成了低分辨率的 TIFF 文件,标准的 LLM 视觉模型就会歇菜。错误率会从 1% 飙升到 15% 左右。你需要专门的 OCR 软件先清理图像,这会让搭建过程变得极其复杂。

如果你的内部业务规则根本没写清楚,这招也灵不了。如果你的运营经理退款是靠「看这个客户顺不顺眼」这种直觉,你没法给这事儿写指令。LLM 需要明确的、可衡量的逻辑。

比如:如果客户年限大于两年,且商品价值低于 £50,则批准退款。在写任何一行 webhook 代码之前,你必须先把这种逻辑理清楚。如果你跳过这一步,系统只会更有自信地大规模做出错误的决策。

要避开的三个坑

  1. 别在第一天就给全公司买账号。 忍住那种想给 50 个员工全开通 Copilot 或 Gemini 看看会发生什么的冲动。你的团队会新鲜两个礼拜,用它写写邮件,然后觉得无聊,又回到老习惯上去。最后你会发现自己背着巨额的年度订阅费,却没换来任何业务回报。先从某个特定部门的五人小组开始试点,找一个明确的场景。
  2. 别用办公 AI 搬运结构化数据。 别指望聊天助手能帮你把数据在核心系统之间挪来挪去。Copilot 总结 Word 文档很厉害,但要让它把客户邮件里的嵌套字段准确地填进复杂的 Pipedrive CRM 里,它就很不靠谱。它出错时是悄无声息的,直到销售丢了大单你才会发现。搬运数据请用 Make 或 n8n 这种专门的自动化工具。
  3. 别忽视「影子 AI」的隐形成本。 你自己花大钱买 Copilot,结果底下各部门经理还在报销自己的 ChatGPT Plus 或 Claude Pro 账号,这事儿挺蠢的。这会让你的公司数据散落在各种没人管的账号里,不仅有巨大的安全风险,还让你没法建立统一的全公司工作流。把 AI 工具收拢起来,去搭真正的业务系统。

订阅获取 UK AI 洞察。

针对英国企业的 AI 实战内容 —— 拆解、教程、监管解读。随时取消。

随时取消。