Google 上线 Gemini 2.5 Pro 模型

文強发表于 2025-3-26 19:26

今日凌晨，Google 正式上线了「最强推理大模型」Gemini 2.5 Pro Experimental，其在多项测试中表现相当出色：

• 在大模型榜单 LMSYS Arena 上排名第一，分数比 Grok-3、GPT-4.5 高出 40 分；
• 在所有评测类别（综合能力、编码、数学等）中均排名第 1，尤其在带风格控制的复杂提示（Hard Prompts w/ Style
   Control）和多轮对话（Multi-Turn）表现突出；
• 在个基准测试上，Gemini 2.5 Pro 综合表现拿下最佳。其中科学（Science）、代码生成、视觉推理（MMMU）和长文
   本理解（MRCR）上均领先；
• 在号称最难的测试「人类最后一次考试」中，Gemini 2.5 Pro 超越 OpenAI o3-mini、GPT-4.5、DeepSeek-R1 等一众大
   模型。

此外，Gemini 2.5 Pro Experimental 还在其他领域表现出色：

• Gemini 2.5 Pro 还具备多模态能力，在 Vision Arena 视觉排行榜上依然第 1；
• 网页开发榜单 WebDev Arena 上排名第 2，仅次于 Claude-3.7。

目前，Gemini 2.5 Pro Experimental 已经可以在 Google AI Studio 和 Gemini APP 中使用了。

🔗 链接：https://aistudio.google.com/prompts/new_chat

文章来源：爱范儿

页: [1]

's Archiver

Google 上线 Gemini 2.5 Pro 模型