Meta 开源多模态大模型 Llama 4

文強发表于 2025-4-7 13:56

昨日，Meta 突然公布并开源了最新多模态大模型 Llama 4。据官方介绍，Llama 4 全系采用混合专家（MoE）架构，目前最强的开源多模态大模型，其重点为「文本、图像与视频的全能选手」。下面是几款模型的具体特点：

Llama 4 Scout：

• 面向文档摘要与大型代码库推理任务，专为高效信息提取与复杂逻辑推理打造；
• 共有 1090 亿参数，170 亿激活参数量；
• 上下文长度 1000 万 tokens（目前行业最长）。

Llama 4 Maverick：

• 以通用助手与聊天应用为核心，具备顶级的多语言支持与编程能力；
• 共有 4000 亿参数，170 亿激活参数量，分布于 128 个专家模块；
• 在大模型竞技场（Arena）中突破 1400 分，总排名第二；其中开放模型超越 DeepSeek V3 排名第一。
• 下载链接：https://www.llama.com/llama-downloads/

Llama 4 Behemoth（预览）：

• 未来最强大的 AI 模型之一，具备令人瞩目的超大规模参数架构；
• 2880 亿激活参数量，总参数 2 万亿（消费级根本跑不动）；
• 目标：在多模态处理与推理能力上实现突破；
• 这么庞大的模型训练需要巨量计算资源和时间，据悉在推理和数学任务等技术基准上仍未达预期。

值得一提的是，Llama 4 Scout 使用 Int4 量化就可以在单个 H100 GPU 上运行，Llama 4 Maverick 则可以直接在 H100 主机上运行。

值得一提的是，此前曾有消息称 DeepSeek 让 Meta AI 团队陷入恐慌：

文章来源：爱范儿

页: [1]

's Archiver

Meta 开源多模态大模型 Llama 4