请选择 进入手机版 | 继续访问电脑版

BoonKiong.com2025™

人气 285

百度推出新模型,可处理文本和图像

文***已获得官方认证 2024-1-20 19:12



Jan-19-2024-20-44-49.gif


百度新推出的 UniVG 是一款视频生成模型,其特点在于针对高自由度和低自由度两种任务分别采用不同的生成方式,以更好地平衡两者之间的关系。

目前视频生成技术主要集中在单一目标或单一任务的视频生成上,例如根据文本、图片或它们的组合生成视频。但这样的方法并不能完全满足真实世界多变的应用需求。

为了解决这一问题,百度提出了 UniVG,一种「统一模态视频生成系统」,能够处理各种文本和图像的组合输入。

该系统重新定义了视频生成模型中的多项任务,将它们划分为「高自由度生成」和「低自由度生成」两大类。

在高自由度视频生成方面,采用了「多条件交叉注意力」技术,以生成与输入的图像或文本语义高度一致的视频。

而在低自由度视频生成方面,引入了「偏置高斯噪声」,这种方法相较于传统的完全随机高斯噪声更能有效地保留输入条件的原始内容。





<
您需要登录后才可以回帖 登录 | 立即注册

您还未登录

随手拍~~:

热门推荐~~:

论坛表情分享...

1、洋葱头 ...

Discuz! X3.5 解决小图标不显示的方法...

我发现大多数使用Discuz! X3.5 都有小图标不能显示的问题,提问的时候大家给的回答都是说跨域的问题, ...

如何在 discuz 帖子里添加 APlayer 音乐播...

1、首先将下边的 APlayer.css 和 APlayer.js 代码下载然后解压上传到服务器。 2、单曲音乐的代 ...

Discuz! 相关帖子功能修改随机显示不依赖标...

打开 source/module/forum/forum_viewthread.php 文件,查找: 换行添加: 再查找: 换行添 ...

Discuz! X3.5 手机版 logo 的路径...

打开以下的模板文件,搜索 logo_m.svg 1.template/default/touch/portal/index.htm 2.template/def ...

热度会员~~:

文強bkboonkiongadmin老谟深虑TaChuaekinanas风铃吴迪tiaoyaonanAsd9786

免责声明~~:


本站内容来源于合作伙伴及网络搜集,版权归原作者所有。如有侵犯版权,请立刻和本站联系,我们将在三个工作日内予以改正。
Email:hsbk@hotmail.com

服务与条款|隐私政策|免责声明|手机版|网站地图|友链申请| 文强阁

Powered by Discuz! X3.5|© 2001-2025 Discuz! Team. |本站总访问量已经运行: