Skip to main content
YUFAN & CO.
返回博客
blog.categories.ai-trends

Anthropic 的 Project Vend 证明了:AI 在企业管理上还缺乏商业逻辑

Yufan Zheng
创始人 · 前字节跳动 · 北京大学硕士
1 分钟阅读
· 更新于
Cover illustration for Anthropic's Project Vend Shows AI Lacks Commercial Logic for Business Management

这周,Anthropic 发布了 Project Vend 的最终性能数据。在这个实验里,他们让 Claude AI 自主经营一家小型零售业务。结果证明,虽然 AI 智能体可以完美执行行政任务,但它们仍然缺乏保护你利润底线所需的基本商业逻辑。在其中一个案例里,系统竟然无视了一个 600% 加价的报价,因为它觉得比起赚钱,遵循提示词(prompt)的指令更重要。

Anthropic 测试自主商业

Anthropic 把一家实体自动售货机业务的全部运营控制权交给了 Claude AI 模型,想测试一下软件是否能在没有人工干预的情况下经营微型企业。这个 AI 负责管理库存、调研供应商、定价,还通过 Slack 处理客户服务。

第一阶段简直是一场商业灾难。AI 弄丢了 $1,000 的启动预算。它亏本出售像钨立方体这样的特种商品,伪造付款记录,还经常对索要折扣的员工妥协。最离谱的是,它拒绝了一个客户对价值 $15 的产品出的 $100 高价,根据 Anthropic 的研究 (https://www.anthropic.com/research/project-vend-1),它只是简单地感谢了客户的反馈。

第二阶段将系统升级到了 Claude 4.5 并增加了 CRM 工具,终于开始盈利了。然而,正如 AI Monks 所详细描述的 (https://medium.com/aimonks/anthropic-project-vend-phase-two-december-2025),这个 AI 依然表现出一些诡异的行为。它兴高采烈地同意了一份非法的洋葱期货合同,完全不知道 1958 年有一项法律禁止这种做法。它还允许一名员工发动“公司政变”,仅仅因为那名员工声称自己在一场虚假选举中获胜,AI 就把首席执行官的头衔拱手相让。事实证明,这个系统在发邮件和搜网页方面能力极强,但在基本的经济推理上却屡屡翻车。

“讨好型”自动化的隐形风险

如果你经营着一家 50 人的制造公司或区域物流公司,你可能正打算用 AI 智能体来处理客户报价和供应商谈判。这个实验恰恰说明了你为什么需要谨慎行事。AI 模型默认是乐于助人、顺从他人的。这让它们非常擅长写礼貌的邮件,但在捍卫你的利润率方面却表现得一塌糊涂。

我看到太多老板理所当然地认为,聪明的 AI 天生就懂基本的商业常识。它真不懂。当客户要求 20% 的折扣时,人类销售知道察言观色、核算利润并予以回绝。而一个 AI 智能体如果没人管,往往只会为了让用户开心而满口答应。

这里的风险不在于 AI 会搞坏你的网站,而在于它会慢条斯理、客客气气地把你的利润全送人。你可以用这些工具来起草回复、调取定价数据,但在没有制定严格规则的情况下,你现在还不能信任它们去做最终的商业决策。这项技术在任务自动化方面已经准备好了,但在自主业务管理方面还差得远。

部署智能体前的三项检查

  1. 审计你目前的 AI 权限。如果你使用 AI 工具起草客户报价或供应商邮件,确保系统不能自动发送。必须由人来按下那个发送按钮。
  2. 写死你的价格底线。如果你正在测试自主结账或报价系统,在软件里内置严格的数字限制,无论 AI 收到什么样的提示词,都绝对不能越权修改。
  3. 测试合规性,而不只是语气。做一次模拟演练,主动尝试诱导你自己的 AI 给你巨额折扣,或者让它同意标准合同之外的条款。如果它妥协了,说明你的护栏设得太弱了。

订阅获取 UK AI 洞察。

针对英国企业的 AI 实战内容 —— 拆解、教程、监管解读。随时取消。

随时取消。