Anthropic推出Project Deal：Claude自主完成186笔交易，总金额超4000美元

2,100 0

项目背景与核心成果

Anthropic近期发布了名为 **Project Deal** 的实验性项目，旨在测试其旗舰模型 Claude 在真实商业场景中的自主交易能力。据官方披露，Claude 在受控环境下成功完成了 **186笔独立交易**，累计交易金额超过 **4000美元**。这些交易涵盖了从在线购物、优惠券匹配到价格谈判等多种电商环节，标志着 AI 从“对话助手”向“行动代理”迈出了实质性的一步。

技术实现与操作流程

Project Deal 的核心逻辑并非简单的 API 调用，而是构建了一个 **“感知-决策-执行”闭环**。Claude 需要自主识别用户意图（例如“找到最便宜的蓝牙耳机”），然后访问电商网站、解析商品页面、比较价格与优惠券，甚至模拟人类进行结账操作。整个过程涉及网页导航、表单填写、支付信息处理等复杂步骤，且要求模型具备 **上下文记忆与错误恢复能力**——例如当某张优惠券失效时，Claude 需主动尝试替代方案。

Anthropic 强调，所有交易均在 **沙盒环境** 中完成，使用虚拟信用卡和测试账户，确保不会产生真实资金风险。但即便如此，186笔交易无一失败，且平均每笔交易耗时仅约 **2.3分钟**，效率显著高于人工操作。

行业意义与潜在挑战

这一成果凸显了 **大语言模型在工具使用与多步骤任务执行** 上的突破。传统 AI 助手擅长信息检索，但缺乏“完成交易”所需的行动力。Project Deal 证明，通过精心设计的提示工程与系统架构，AI 可以成为可靠的 **数字代理人**，在用户授权范围内代为处理繁琐的采购流程。

然而，该技术也面临 **安全性与信任** 的严峻考验。如何防止模型被恶意 Prompt 诱导执行非授权交易？如何确保支付信息不被泄露？Anthropic 在博客中承认，当前方案依赖严格的权限隔离与人工审核，距离完全自主的商用部署仍有距离。此外，电商网站的反爬机制与动态页面结构，也可能成为规模化落地的技术瓶颈。

未来展望

Project Deal 为 **AI 驱动型商务** 开辟了新可能：从自动比价、定时抢购到批量采购，Claude 这样的模型有望重塑个人与企业的消费行为。Anthropic 计划下一步将项目扩展至 **多平台协同**（如同时操作亚马逊、eBay 和本地零售系统），并引入 **预算约束与偏好学习**，让 AI 真正成为用户的“智能采购员”。但在此之前，行业需要共同制定 **AI 代理的操作规范与责任界定标准**，以平衡效率与风险。