Claude Sonnet 4.5 新功能速览
Claude Sonnet 4.5 是我们迄今为止最适合用来构建复杂 AI 智能体 (AI Agent) 的模型,这些智能体可以长时间独立工作。它在编程能力上取得了前沿性的突破,在计算机使用方面达到了业界顶尖水平,并且在金融分析、网络安全和科学研究等领域的智能体应用中表现卓越。
相比 Sonnet 4 的主要升级
卓越的编程能力
Claude Sonnet 4.5 是我们目前最强的编程模型,在整个软件开发生命周期中都有显著提升:
• SWE-bench 权威认证的性能:在多个编程基准测试中刷新了业界最高水平。
• 更强的规划与系统设计能力:能做出更优秀的软件架构决策和代码组织。
• 改进的安全工程实践:具备更稳健的安全实践能力和漏洞检测能力。
• 更精准的指令遵循:能更精确地遵循编程规范和需求。
开启“扩展思考”以获得最佳性能:当启用扩展思考功能时,Claude Sonnet 4.5 在处理编程任务时表现会大幅提升。该功能默认关闭,但我们强烈建议在处理复杂编程工作时开启它。请注意,开启扩展思考会影响提示词缓存的效率。具体配置方法请参见迁移指南。
智能体能力
Claude Sonnet 4.5 在 AI 智能体能力上实现了重大飞跃:
• 更长的自主运行时间:Sonnet 4.5 可以连续数小时独立工作,同时保持思路清晰,专注于渐进式地完成任务。模型会稳扎稳打,一次处理几个任务,而不是试图一次性解决所有问题。它提供的进度更新都基于事实,能准确反映已完成的工作。
• 上下文感知:Claude 现在可以在整个对话过程中追踪自己的 Token 使用情况,并在每次工具调用后收到更新。这种感知能力有助于防止它过早放弃任务,并使其在执行长期任务时更加高效。技术细节请参见上下文感知,提示词编写建议请参见Claude 4 最佳实践。
• 更强的工具使用能力:模型能更有效地进行并行工具调用。例如,在研究时同时发起多个推测性搜索,或一次性读取多个文件以更快地建立背景信息。通过改进跨多个工具和信息源的协调能力,模型可以在智能体搜索和编程工作流中,有效地利用各种能力。
• 先进的上下文管理:Sonnet 4.5 在外部文件中保持着出色的状态追踪能力,即使跨越不同会话也能保持对目标的专注。结合更高效的上下文窗口利用率和我们新的上下文管理 API 功能,模型可以在长时间的会话中对信息进行最佳处理,始终保持连贯性。
沟通与互动风格
Claude Sonnet 4.5 拥有更加精炼的沟通方式,风格简洁、直接且自然。它会提供基于事实的进度更新,并且在工具调用后可能会跳过冗长的总结,以保持工作流程的顺畅(当然,这一点可以通过提示词进行调整)。
想了解如何更好地与这种沟通风格协作,请参阅 Claude 4 最佳实践。
创意内容生成
Claude Sonnet 4.5 在创意内容生成任务上表现出色:
• 演示文稿和动画:在制作幻灯片和视觉内容方面,其表现与 Claude Opus 4.1 相当,甚至更优。
• 创意闪光:能够产出精美、专业的作品,并能很好地遵循指令。
• 一次成功的高质量:在初次尝试时就能生成设计精良、可直接使用的内容。
全新 API 功能
记忆工具 (Beta)
全新的记忆工具 (memory tool) 能让 Claude 在上下文窗口之外存储和检索信息:
tools=[
{
"type": "memory_20250818",
"name": "memory"
}
]
点击图片查看原图