文強 发表于 2025-4-7 13:56

Meta 开源多模态大模型 Llama 4





昨日,Meta 突然公布并开源了最新多模态大模型 Llama 4。据官方介绍,Llama 4 全系采用混合专家(MoE)架构,目前最强的开源多模态大模型,其重点为「文本、图像与视频的全能选手」。下面是几款模型的具体特点:

Llama 4 Scout:

   •   面向文档摘要与大型代码库推理任务,专为高效信息提取与复杂逻辑推理打造;
   •   共有 1090 亿参数,170 亿激活参数量;
   •   上下文长度 1000 万 tokens(目前行业最长)。

Llama 4 Maverick:

   •   以通用助手与聊天应用为核心,具备顶级的多语言支持与编程能力;
   •   共有 4000 亿参数,170 亿激活参数量,分布于 128 个专家模块;
   •   在大模型竞技场(Arena)中突破 1400 分,总排名第二;其中开放模型超越 DeepSeek V3 排名第一。
   •   下载链接:https://www.llama.com/llama-downloads/

Llama 4 Behemoth(预览):

   •   未来最强大的 AI 模型之一,具备令人瞩目的超大规模参数架构;
   •   2880 亿激活参数量,总参数 2 万亿(消费级根本跑不动);
   •   目标:在多模态处理与推理能力上实现突破;
   •   这么庞大的模型训练需要巨量计算资源和时间,据悉在推理和数学任务等技术基准上仍未达预期。

值得一提的是,Llama 4 Scout 使用 Int4 量化就可以在单个 H100 GPU 上运行,Llama 4 Maverick 则可以直接在 H100 主机上运行。

值得一提的是,此前曾有消息称 DeepSeek 让 Meta AI 团队陷入恐慌:

文章来源:爱范儿




页: [1]
查看完整版本: Meta 开源多模态大模型 Llama 4