Google 上线 Gemini 2.5 Pro 模型
今日凌晨,Google 正式上线了「最强推理大模型」Gemini 2.5 Pro Experimental,其在多项测试中表现相当出色:
• 在大模型榜单 LMSYS Arena 上排名第一,分数比 Grok-3、GPT-4.5 高出 40 分;
• 在所有评测类别(综合能力、编码、数学等)中均排名第 1,尤其在带风格控制的复杂提示(Hard Prompts w/ Style
Control)和多轮对话(Multi-Turn)表现突出;
• 在个基准测试上,Gemini 2.5 Pro 综合表现拿下最佳。其中科学(Science)、代码生成、视觉推理(MMMU)和长文
本理解(MRCR)上均领先;
• 在号称最难的测试「人类最后一次考试」中,Gemini 2.5 Pro 超越 OpenAI o3-mini、GPT-4.5、DeepSeek-R1 等一众大
模型。
此外,Gemini 2.5 Pro Experimental 还在其他领域表现出色:
• Gemini 2.5 Pro 还具备多模态能力,在 Vision Arena 视觉排行榜上依然第 1;
• 网页开发榜单 WebDev Arena 上排名第 2,仅次于 Claude-3.7。
目前,Gemini 2.5 Pro Experimental 已经可以在 Google AI Studio 和 Gemini APP 中使用了。
🔗 链接:https://aistudio.google.com/prompts/new_chat
文章来源:爱范儿
页:
[1]