为什么 Anthropic 的最新 Claude 模型可能成为新的 AI 竞争对手

Anthropic 的Claude AI现在拥有一个新模型,在对您的请求做出回应时能够“思考”更长时间、更深入。

这个最新模型被称为 Claude 3.7 Sonnet,它使用高级推理和更长的处理时间,逐步评估您的问题,然后得出详细的结果。但还有更多。

据 Anthropic 公司称,新款 Claude 不仅是该公司迄今为止最智能的模型,而且是首个混合推理模型。在这种情况下,混合意味着它可以对您的请求做出几乎即时的响应,或者使用扩展思维来提供更长、更详细的解决方案。

为了处理不同类型的请求,Claude 提供了两种不同的模式。Anthropic 解释道,普通模式最适合大多数用例。扩展模式最适合数学和编码挑战。根据您的查询,您可以轻松地在普通模式(用于快速简洁的答案)和扩展模式(用于更深入的分析)之间切换。

新模式并非免费

新的扩展思维模式可通过Claude 网站和开发人员 API访问。但它不是免费的。尽管 Claude 3.7 Sonnet 可供所有用户使用,但您必须拥有Pro或Team订阅才能使用扩展思维选项。

Anthropic 在周一的公告中表示,扩展模式特别擅长解决困难的数学和编码问题,以及前端 Web 开发。在这种模式下,Claude 会在给出答案之前进行“自我反思”。花时间开发其响应有助于它更好地处理涉及数学、物理、遵循指令和编码的任务。在此过程中,Claude 会向您展示它得出解决方案的步骤。

Anthropic 在其公告中还大力宣传了 Claude 3.7 Sonnet 在早期测试和使用中的表现。一个网站发现新模型在处理复杂代码库和使用高级工具方面有显著改进。另一个网站成功地使用 Claude 从头开始​​构建复杂的 Web 应用程序和仪表板——这是一项对其他模型具有挑战性的任务。在第三次评估中,Claude 创建了可用于生产的代码,设计质量高,错误明显减少。

比 OpenAI 的 o1 好吗?

代理工具测试显示,Claude 3.7 Sonnet 领先于 Sonnet 3.5/3.6 版本和 OpenAI 的 o1 模型。软件工程测试显示,Claude 3.7 Sonnet 在前一版本、 OpenAI 的 o1和DeepSeek R1中名列前茅。

Anthropic 在公告中表示:“我们开发 Claude 3.7 Sonnet 的理念与市场上其他推理模型不同。正如人类使用单个大脑进行快速反应和深度思考一样,我们认为推理应该是前沿模型的综合能力,而不是完全独立的模型。这种统一的方法也为用户创造了更无缝的体验。”

如何尝试 Claude 3.7 Sonnet 和 Claude Code

如果您是 Pro 或 Team 订阅者,您可以尝试 Claude 的新扩展模式。前往网站。单击模型的下拉菜单。确保选择了 Claude 3.7 Sonnet,并将思维模式从正常更改为扩展。输入并提交您的请求。例如,我要求 Claude 创建一个网页,比较 Anthropic、OpenAI 和Google 提供的不同 AI 模型。

作为响应,Claude 在生成 HTML 和 CSS 代码时显示了每一行。当 Claude 完成工作后,我能够在 HTML 模式或预览模式下查看页面。这里和其他类型的请求的唯一缺点是,Claude 的信息仅截至 2024 年 10 月。这意味着它不会知道截止日期之后的实时事件和信息。

对于不太困难的请求,您可以始终坚持使用普通模式。在这种情况下,您的问题通常会得到更快的答复,并且答复更简短、更简洁。

目前,Claude Code 仍处于有限研究预览阶段,它可以搜索和读取代码、编辑文件、编写和运行测试以及将代码提交和推送到GitHub。Anthropic援引早期测试称,Claude Code 能够一次性完成原本需要 45 分钟以上人工操作的任务。

未来几周内,Claude Code 将添加一些新功能,例如更好的工具调用可靠性、对长时间运行命令的支持以及改进的应用内渲染。有兴趣尝试 Claude Code 的开发人员应前往概览网站,在那里他们可以加入候补名单以注册研究预览。

Anthropic 表示:“我们开发 Claude Code 的目的是更好地了解开发人员如何使用 Claude 进行编码,以便为未来的模型改进提供参考。通过加入此预览版,您将可以使用我们用于构建和改进 Claude 的强大工具,您的反馈将直接影响其未来。”

标签



热门标签