夜间模式
请选择 进入手机版 | 继续访问电脑版

BoonKiong.com2025™

人气 91

DeepSeek 开源第四弹公布,梁文锋亲自下场开发

文強已获得官方认证 2025-2-28 14:48



9bba212b-e8c6-4e44-bdb0-da9e32bac000.jpg


昨日,来到了 DeepSeek 开源周的第四天,开源了 DualPipe 和 EPLB 两项技术,其中还有梁文锋亲自参与的项目。

具体来看,DualPipe 为一种用于 DeepSeek-V3 / R1 训练中,让「前向计算」和「反向传播」同时进行的双向管道并行算法,通过该算法能够减少训练过程中的空闲时间。根据技术报告,使用 DualPipe 技术的 DeepSeek-V3 预训练仅需 278.8 万 H800 GPU 小时,成本约为 557.6 万美元,这一成本远低于同规模模型的预期。

值得注意的是,DeepSeek 创始人梁文锋本人也参与了 DualPipe 的开发。

而 EPLB(Expert Parallel Load Balancing)是用于优化大型语言模型在专家并行(Expert Parallelism, EP)架构中的训练效率。它通过动态调整专家(MoE 模型中的子网络)的分配来平衡 GPU 之间的工作负载,同时减少跨节点通信开销。

此外,据 DeepSeek 近期公开分享出来的训练和推理框架,所涉及到性能分析数据也进一步披露了,开发者们能更好地理解通信-计算重叠策略和低级实现细节。性能分析数据是使用 PyTorch Profiler 捕获的,可以通过 Chrome 插件直接对其进行可视化,也可以当作一种性能检测的方式。






<
您需要登录后才可以回帖 登录 | 立即注册

您还未登录

随手拍~~:

热门推荐~~:

论坛表情分享...

1、洋葱头 ...

Discuz! X3.5 解决小图标不显示的方法...

我发现大多数使用Discuz! X3.5 都有小图标不能显示的问题,提问的时候大家给的回答都是说跨域的问题, ...

如何在 discuz 帖子里添加 APlayer 音乐播...

1、首先将下边的 APlayer.css 和 APlayer.js 代码下载然后解压上传到服务器。 2、单曲音乐的代 ...

Discuz! 相关帖子功能修改随机显示不依赖标...

打开 sourcemoduleforumforum_viewthread.php 文件,查找: 换行添加: 再查找: 换行添 ...

Discuz! X3.5 手机版 logo 的路径...

打开以下的模板文件,搜索 logo_m.svg 1.template/default/touch/portal/index.htm 2.template/def ...

热度会员~~:

文強bkboonkiongadmin老谟深虑TaChuaekin海岛tiaoyaonanosifefei220088小甜天

免责声明~~:


本站内容来源于合作伙伴及网络搜集,版权归原作者所有。如有侵犯版权,请立刻和本站联系,我们将在三个工作日内予以改正。
Email:hsbk@hotmail.com

服务与条款|隐私政策|免责声明|手机版|网站地图|友链申请| 文强阁

Powered by Discuz! X3.5|© 2001-2025 Discuz! Team. |本站总访问量已经运行: