Skip to main content
YUFAN & CO.
返回博客
blog.categories.aigc

别再花冤枉钱,让你那月薪不菲的运营经理去当「人工 API」了

Yufan Zheng
创始人 · 前字节跳动 · 北京大学硕士
1 分钟阅读
· 更新于
Cover illustration for Why You Are Paying Your Ops Manager to Be a Human API

你正站在运营经理的桌子后面。你看着她打开一封邮件,下载 PDF 附件,然后手动把里面的条目一条条复制粘贴到 Xero 里。她每天要重复这套动作 40 次。

她的年薪是 £35,000。而你付钱给她,只是让她充当一个「人形 API」。

你可能读过那些关于 AI 编程智能体和快速原型的文章,甚至还给团队买了一堆 ChatGPT 账号。但什么都没改变。PDF 照样发过来,手动录入数据照样在发生。

你在网上看到的 AI 演示,和经营一家年营收 £5M 的供应链企业的现实之间,存在巨大的断层。演示里代码几秒钟就写好了;现实中,你的团队还在共享收件箱里苦苦挣扎。

以下才是真正管用的法子。

£40k 的「对账税」

所谓的「对账税」,就是当你雇人去填补两个死活不肯互相说话的软件系统之间的鸿沟时,所产生的隐形成本。这就是你运营经理的工资——全花在了把供应商的 PDF 数据搬运到 Xero 里。

没人想把生意做成这样。刚开始你只有一个供应商,然后变成 10 个,最后变成 50 个。

突然间,你最能干的员工每个月要花三天时间从 Outlook 下载附件。他们得对着 Stripe 的打款记录手动核对 Shopify 的订单号。他们把条目一个个敲进 QuickBooks。他们还得把 Pipedrive 里的单子和银行到账的真金白银反复比对。

一团乱麻。没人知道为什么。就这么回事。

这里的结构性问题在于,传统的 API 太死板了。它们要求数据必须完美。如果物流合作伙伴改了发票排版,或者在页脚加了一行燃油附加费,标准的集成系统就会崩溃。代码会报错,然后直接罢工。

于是你只能堆人力。你花高价雇一个人类大脑去做脚本该干的事,仅仅是因为脚本处理不了模糊信息。你的运营经理并没在做高价值的工作,他们只是在两个笨数据库之间充当了一个昂贵的「翻译层」。

这种「税」是随规模线性增长的。收入越高,文书工作就越多。你招了个初级分析师,接着又招了个会计助理。你并没有扩大产出,你只是在增加管理成本,好让系统不至于散架。

为什么 Zapier 和 ChatGPT 订阅没用

Zapier 搞不定,是因为它处理不了非结构化数据;ChatGPT 搞不定,是因为它没法稳定地输出结构化结果。大多数中小企业试图通过给团队买 ChatGPT Plus 或者把一堆 Zapier 流程串在一起来解决运营问题。这看起来像是在进步,其实不然。

Zapier 处理线性、可预测的数据确实很漂亮。但 B2B 业务从来就不是可预测的。

现实情况通常是这样的:你搭了一个 Zapier 流程来解析进来的邮件。Zapier 的「查找」(Find)步骤没法嵌套。所以当你在 Xero 里的供应商有个藏了两层的自定义联系人字段时,自动化流程会静默地写入一个空值(null)。你只有在月底要交增值税申报表时才会发现。

这确实很烦人,但走 ChatGPT 路线更糟。

每月 $25 的 ChatGPT 订阅替代不了一份 £35k 的薪水,原因在这:你的会计助理不只是在读文字,他们还在应用「业务逻辑」。他们知道如果供应商 A 的发票上有「运费」,就归入 400 号成本科目;如果是供应商 B,就归入 401。他们知道哪些客户有特殊的付款条款。

浏览器窗口里的 ChatGPT 会忘掉这些背景信息。它会被多页 PDF 搞糊涂。它会幻觉出一个税码。根据我的经验,一旦你每周处理的发票超过 40 张,这些现成的 AI 配置就会漏掉大约 12% 的自定义条目。

它们失败是因为缺乏状态、记忆和严格的输出模式。你是在让一个聊天机器人去做结构化数据工程。只要用户还得复制提示词、粘贴到聊天窗口、上传文件,再手动把结果拷回 HubSpot,你就压根没实现自动化。你只是给那份 £40k 的「对账税」又增加了几个步骤。

用 Claude 4.5 Opus 来构建

用 Claude 4.5 Opus 来构建

Webhook 触发器将杂乱的 PDF 传给 Claude 4.5 Opus,生成标准 JSON 供 Xero 自动处理。

使用 Anthropic 的 Claude 4.5 Opus 进行快速原型开发之所以有效,是因为这个模型能像人一样处理模糊信息,同时又能像脚本一样输出结构化数据。举个实操例子:你收到一份来自物流供应商的、乱七八糟的非结构化 PDF 发票。里面有合并单元格、奇怪的列标题,页脚还藏着燃油附加费。

别用 Zapier,用 n8n。当邮件进入特定的 Gmail 收件箱时,触发一个 n8n webhook。n8n 提取 PDF 并直接传给 Claude 4.5 Opus 的 API。

注意这一步:你不要只是让 Claude 「读一下发票」。你要传给 Claude 一个严格的 JSON schema。你明确告诉它 Xero 需要哪些字段。你定义好条目数组、税率字符串和供应商联系人 ID。你在系统提示词(system prompt)里写进你具体的业务规则。

Claude 利用其 200,000-token 的上下文窗口阅读整个文档。它会应用你的逻辑。它会忽略 PDF 顶部的促销横幅,忽略底部的条款说明。它会返回一个格式完美的 JSON 对象,里面只包含你要求的数据。

然后 n8n 拿到这个 JSON,直接通过 PATCH 接口更新 Xero 的发票条目。

全程无人触碰。数据从一封非结构化邮件变成结构化数据库条目,大约只需要 4 秒钟。

这行得通,是因为 Claude 4.5 Opus 与早期的模型有本质区别。Anthropic 把输入 token 的价格降到了每百万 $5,这便宜到足以让它跑在每一封邮件上 (https://www.anthropic.com/news/claude-opus-4-5)。更重要的是,它在 SWE-bench Verified 编程基准测试中得分 80.9%。它理解严格的数据结构。它不会输出废话,它只管干活。

如果你雇个开发来做这个,预计需要 2-3 周的开发时间。根据你现有的集成情况,成本在 £6k 到 £12k 之间。你付的是「管道工程」的钱,而不是 AI 的钱。

但你必须捕捉失效模式。如果供应商用的是美式日期格式,Claude 偶尔可能会在日期格式上产生幻觉。解决方法是在 n8n 里加一个验证节点。如果解析出的增值税额与小计对不上,n8n 就会跳过 Xero 推送,并给运营经理发一条 Slack 消息。

只有当机器人标记出异常时,人才介入。你彻底反转了工作流:你的团队在管理「异常」,而不是在跑「基础流程」。

哪里会掉链子

如果你的输入数据需要光学字符识别(OCR),或者你的目标软件没有现代化的 API,这套方法立马就会失效。这套系统很强大,但不是魔法。

在开始构建之前,你需要检查你的输入源。如果你的发票是老旧财务软件扫出来的 TIFF 图片,你得先接一个 OCR 步骤。一旦依赖 OCR,错误率就会从 1% 飙升到 12% 左右。

Claude 4.5 Opus 读不出污渍。如果人眼都看不清扫描件,API 就会靠猜。而在会计行业,靠猜是会被开除的。

你还需要干净的 API 访问权限。如果你用的是 2008 年产的、只能通过 FTP 服务器导出 CSV 文件的冷门 ERP 系统,千万别试着把 AI 智能体接进去。服务器每次重启,集成都会断掉。你花在调试连接上的时间,会比你手动录入数据的时间还要多。

另一个坑是复杂的多系统状态。如果审批一张发票需要查看 Slack 频道、Notion 文档和纸质签收单,上下文窗口就会变得太嘈杂。Claude 4.5 Opus 擅长将非结构化数据映射到结构化模式,但它并不擅长去催你的仓库主管签字。

先修好你的「管道」。标准化你的内部沟通。把数据迁移到有文档齐全的 REST API 的系统中。

只有到那时,才应该引入智能。

问题不在于 AI 是否会取代你的运营经理。而在于你是否清楚,在她的一周时间里,哪 £32k 的成本其实是在做 Xero 和 Stripe 的对账——因为那是今年机器人唯一能碰的部分。你不需要等什么神奇的 SaaS 产品来解决这个问题。

基础组件已经在这了:Claude 4.5 Opus 给你推理引擎,n8n 给你双手。你只需要把它们连起来。别再买那些通用的订阅服务并指望团队自己能搞明白了。开始梳理那些耗干你工资单的具体数据流,并构建专门的内部工具来自动化它们。

订阅获取 UK AI 洞察。

针对英国企业的 AI 实战内容 —— 拆解、教程、监管解读。随时取消。

随时取消。