文強 发表于 2025-3-26 19:26

Google 上线 Gemini 2.5 Pro 模型





今日凌晨,Google 正式上线了「最强推理大模型」Gemini 2.5 Pro Experimental,其在多项测试中表现相当出色:

   •   在大模型榜单 LMSYS Arena 上排名第一,分数比 Grok-3、GPT-4.5 高出 40 分;
   •   在所有评测类别(综合能力、编码、数学等)中均排名第 1,尤其在带风格控制的复杂提示(Hard Prompts w/ Style
       Control)和多轮对话(Multi-Turn)表现突出;
   •   在个基准测试上,Gemini 2.5 Pro 综合表现拿下最佳。其中科学(Science)、代码生成、视觉推理(MMMU)和长文
       本理解(MRCR)上均领先;
   •   在号称最难的测试「人类最后一次考试」中,Gemini 2.5 Pro 超越 OpenAI o3-mini、GPT-4.5、DeepSeek-R1 等一众大
       模型。

此外,Gemini 2.5 Pro Experimental 还在其他领域表现出色:

   •   Gemini 2.5 Pro 还具备多模态能力,在 Vision Arena 视觉排行榜上依然第 1;
   •   网页开发榜单 WebDev Arena 上排名第 2,仅次于 Claude-3.7。

目前,Gemini 2.5 Pro Experimental 已经可以在 Google AI Studio 和 Gemini APP 中使用了。

🔗 链接:https://aistudio.google.com/prompts/new_chat

文章来源:爱范儿






页: [1]
查看完整版本: Google 上线 Gemini 2.5 Pro 模型