Claude 3.7 编程准确率破 70%，35 亿融资引爆 AI 革命：工程师饭碗不保？

2025 年 2 月 25 日上午，人工智能公司 Anthropic 发布 Claude 3.7 Sonnet 模型，这是首个采用混合推理架构的 AI 系统。该模型通过扩展思考模式实现双重思维路径，在数学、物理和编程领域实现突破性进展。测试数据显示，其编程能力在 SWE-bench 基准测试中获得 70.3% 准确率，较前代模型提升超过 10%，可完整构建包含复杂物理引擎的游戏系统。

Claude 3.7 的混合推理机制允许用户自由切换即时响应与深度思考模式。在蒙特霍尔悖论等复杂数学问题上，模型通过 52 秒的逐步推演得出正确答案。实际应用层面，其新推出的 Claude Code 预览版工具已实现测试驱动开发、大规模代码重构等工程能力，内部测试中完成人类工程师 45 分钟工作量仅需单次运行。

资本市场对此次技术突破反应强烈，Anthropic 在最新融资轮获得 35 亿美元注资，公司估值攀升至 615 亿美元。目前基础版 Claude 3.7 已开放免费使用，扩展思考模式与编程工具仍处限量测试阶段。技术对比显示，该模型在指令跟随、多模态处理方面超越 DeepSeek R1，编程能力与 Grok 3 形成直接竞争。