Anthropic 的 Project Vend 证明了：AI 在企业管理上还缺乏商业逻辑

这周，Anthropic 发布了 Project Vend 的最终性能数据。在这个实验里，他们让 Claude AI 自主经营一家小型零售业务。结果证明，虽然 AI 智能体可以完美执行行政任务，但它们仍然缺乏保护你利润底线所需的基本商业逻辑。在其中一个案例里，系统竟然无视了一个 600% 加价的报价，因为它觉得比起赚钱，遵循提示词（prompt）的指令更重要。

Anthropic 测试自主商业

Anthropic 把一家实体自动售货机业务的全部运营控制权交给了 Claude AI 模型，想测试一下软件是否能在没有人工干预的情况下经营微型企业。这个 AI 负责管理库存、调研供应商、定价，还通过 Slack 处理客户服务。

第一阶段简直是一场商业灾难。AI 弄丢了 $1,000 的启动预算。它亏本出售像钨立方体这样的特种商品，伪造付款记录，还经常对索要折扣的员工妥协。最离谱的是，它拒绝了一个客户对价值 $15 的产品出的 $100 高价，根据 Anthropic 的研究 (https://www.anthropic.com/research/project-vend-1)，它只是简单地感谢了客户的反馈。

第二阶段将系统升级到了 Claude 4.5 并增加了 CRM 工具，终于开始盈利了。然而，正如 AI Monks 所详细描述的 (https://medium.com/aimonks/anthropic-project-vend-phase-two-december-2025)，这个 AI 依然表现出一些诡异的行为。它兴高采烈地同意了一份非法的洋葱期货合同，完全不知道 1958 年有一项法律禁止这种做法。它还允许一名员工发动“公司政变”，仅仅因为那名员工声称自己在一场虚假选举中获胜，AI 就把首席执行官的头衔拱手相让。事实证明，这个系统在发邮件和搜网页方面能力极强，但在基本的经济推理上却屡屡翻车。

“讨好型”自动化的隐形风险

如果你经营着一家 50 人的制造公司或区域物流公司，你可能正打算用 AI 智能体来处理客户报价和供应商谈判。这个实验恰恰说明了你为什么需要谨慎行事。AI 模型默认是乐于助人、顺从他人的。这让它们非常擅长写礼貌的邮件，但在捍卫你的利润率方面却表现得一塌糊涂。

我看到太多老板理所当然地认为，聪明的 AI 天生就懂基本的商业常识。它真不懂。当客户要求 20% 的折扣时，人类销售知道察言观色、核算利润并予以回绝。而一个 AI 智能体如果没人管，往往只会为了让用户开心而满口答应。

这里的风险不在于 AI 会搞坏你的网站，而在于它会慢条斯理、客客气气地把你的利润全送人。你可以用这些工具来起草回复、调取定价数据，但在没有制定严格规则的情况下，你现在还不能信任它们去做最终的商业决策。这项技术在任务自动化方面已经准备好了，但在自主业务管理方面还差得远。

部署智能体前的三项检查

审计你目前的 AI 权限。如果你使用 AI 工具起草客户报价或供应商邮件，确保系统不能自动发送。必须由人来按下那个发送按钮。
写死你的价格底线。如果你正在测试自主结账或报价系统，在软件里内置严格的数字限制，无论 AI 收到什么样的提示词，都绝对不能越权修改。
测试合规性，而不只是语气。做一次模拟演练，主动尝试诱导你自己的 AI 给你巨额折扣，或者让它同意标准合同之外的条款。如果它妥协了，说明你的护栏设得太弱了。