2025 年 2 月 25 日上午,人工智能公司 Anthropic 发布 Claude 3.7 Sonnet 模型,这是首个采用混合推理架构的 AI 系统。该模型通过扩展思考模式实现双重思维路径,在数学、物理和编程领域实现突破性进展。测试数据显示,其编程能力在 SWE-bench 基准测试中获得 70.3% 准确率,较前代模型提升超过 10%,可完整构建包含复杂物理引擎的游戏系统。
Claude 3.7 的混合推理机制允许用户自由切换即时响应与深度思考模式。在蒙特霍尔悖论等复杂数学问题上,模型通过 52 秒的逐步推演得出正确答案。实际应用层面,其新推出的 Claude Code 预览版工具已实现测试驱动开发、大规模代码重构等工程能力,内部测试中完成人类工程师 45 分钟工作量仅需单次运行。
资本市场对此次技术突破反应强烈,Anthropic 在最新融资轮获得 35 亿美元注资,公司估值攀升至 615 亿美元。目前基础版 Claude 3.7 已开放免费使用,扩展思考模式与编程工具仍处限量测试阶段。技术对比显示,该模型在指令跟随、多模态处理方面超越 DeepSeek R1,编程能力与 Grok 3 形成直接竞争。