夜间模式
请选择 进入手机版 | 继续访问电脑版

BoonKiong.com2025™

人气 159

Anthropic 发布全球首个混合推理模型

文強已获得官方认证 2025-2-25 18:05



1b6887ce-a768-44de-92e4-aaaccc7ee589.jpg


今天凌晨,Anthropic 正式发布 Claude 3.7 Sonnet,成为全球首款双模式混合推理模型;同时 Anthropic 还发布了一款智能编程工具「Claude Code」。

Claude 3.7 Sonnet 在标准模式能够快速响应,而切换到扩展思考(Extended Thinking)模式,能进行深度自我反思,在数学、物理和编程等复杂任务上表现卓越,注重实用导向,不必要拒绝减少 45%,强化代码协作能力。

从基准测试结果来看,Claude 3.7 Sonnet(扩展思维版)适用于强逻辑推理和数学任务。具体来看,在评估 AI 解决真实软件问题能力的 SWE-bench Verified 基准测试中,Claude 3.7 Sonnet 达到了行业领先水平。同时,该模型在 TAU-bench 测试中也表现不错,超越其旧版本与 OpenAI o1。

值得一提的是,Claude 3.7 Sonnet 在 Anthropic 内部的 Pokémon 游戏测试中超越了所有前代模型,展现了更强的决策与规划能力。

与 DeepSeek R1 展示的思考过程相比,Claude 3.7 Sonnet 公开的思考过程相对客观、缺乏个性化表达。Anthropic 表示,未对模型的思维过程进行标准角色训练,希望给予 Claude 最大自由度进行自主思考;并且其认为所谓「思考」过程不一定真实反映了 AI 的内部决策逻辑,因此,Anthropic 未来将基于用户反馈和研究决定是否继续公开 Claude 的思维链。

而 Claude Code 支持直接在终端理解并操作代码库,能一次完成需 45 分钟以上的人工编程任务,专长于测试驱动开发、复杂调试和大规模代码重构,全面支持代码编辑、测试执行等核心开发流程。

目前,Claude 3.7 Sonnet 已适用于所有 Claude 订阅计划,包括免费版、专业版、团队版和企业版,同时也可通过 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 访问。除免费版外,所有平台均支持扩展思考模式。

价格方面,定价与前代模型保持一致,输入 100 万 token/3 美元,输出 100 万 token/15 美元(包括思考过程中使用的 token)。

此外,Claude Code 的预览研究版本也已上架官方网站。






<
您需要登录后才可以回帖 登录 | 立即注册

您还未登录

随手拍~~:

热门推荐~~:

论坛表情分享...

1、洋葱头 ...

Discuz! X3.5 解决小图标不显示的方法...

我发现大多数使用Discuz! X3.5 都有小图标不能显示的问题,提问的时候大家给的回答都是说跨域的问题, ...

如何在 discuz 帖子里添加 APlayer 音乐播...

1、首先将下边的 APlayer.css 和 APlayer.js 代码下载然后解压上传到服务器。 2、单曲音乐的代 ...

Discuz! 相关帖子功能修改随机显示不依赖标...

打开 sourcemoduleforumforum_viewthread.php 文件,查找: 换行添加: 再查找: 换行添 ...

Discuz! X3.5 手机版 logo 的路径...

打开以下的模板文件,搜索 logo_m.svg 1.template/default/touch/portal/index.htm 2.template/def ...

热度会员~~:

文強bkboonkiongadmin老谟深虑TaChuaekin海岛tiaoyaonanosifefei220088小甜天

免责声明~~:


本站内容来源于合作伙伴及网络搜集,版权归原作者所有。如有侵犯版权,请立刻和本站联系,我们将在三个工作日内予以改正。
Email:hsbk@hotmail.com

服务与条款|隐私政策|免责声明|手机版|网站地图|友链申请| 文强阁

Powered by Discuz! X3.5|© 2001-2025 Discuz! Team. |本站总访问量已经运行: