BoonKiong.com2026™

人气 3

DeepSeek 内测「识图模式」,多模态新模型或将发布

文***已获得官方认证 2026-4-30 12:43

dc2b174c-11f0-46a2-9cde-c1bddfc04120.jpg

DeepSeek 昨日开启「识图模式」测试,与现有的「快速模式」、「专家模式」并列,具备完整的多模态图像理解能力,并非简单的 OCR 文字识别。

从实测表现来看,DeepSeek 识图模式的整体准确率较高,在不开启思考模式的情况下,最快半秒即可给出回答。对于电影剧照、抽象图片、商品图等常见场景,识别与理解表现良好。

更值得关注的是其思考过程:在描述画面内容之外,还会主动追问发布者身份、图像隐喻与潜台词,并在推理过程中多次自我纠正,甚至在给出结论前,自发列出问题逐一验证前提假设,呈现出接近人类阅读习惯的推理逻辑。

不过,识图模式目前仍存在明显局限。经典的「数手指」测试中,DeepSeek 首次作答出错,自称「数晕了」,但在用户引导或提示后能够给出正确答案。

此外,识图过程暂不支持联网搜索,仅依赖模型自身知识库作答,对于较新的事物,如苹果今年推出的吉祥物「Finder 酱」,无法识别。

而就在昨天,DeepSeek 多模态团队研究员 Xiaokang Chen 在 X 上发文「Now, we see you. 👀」,并配图 DeepSeek 鲸鱼吉祥物从「蒙眼」到「睁眼」的对比,外界普遍将其解读为多模态新模型即将上线的预告。

文章来源:爱范儿




<
您需要登录后才可以回帖 登录 | 立即注册

您还未登录

随手拍~~:

热门推荐~~:

论坛表情分享...

1、洋葱头 ...

Discuz! X3.5 解决小图标不显示的方法...

我发现大多数使用Discuz! X3.5 都有小图标不能显示的问题,提问的时候大家给的回答都是说跨域的问题, ...

如何在 discuz 帖子里添加 APlayer 音乐播...

1、首先将下边的 APlayer.css 和 APlayer.js 代码下载然后解压上传到服务器。 2、单曲音乐的代 ...

Discuz! 相关帖子功能修改随机显示不依赖标...

打开 source/module/forum/forum_viewthread.php 文件,查找: 换行添加: 再查找: 换行添 ...

Discuz! X3.5 手机版 logo 的路径...

打开以下的模板文件,搜索 logo_m.svg 1.template/default/touch/portal/index.htm 2.template/def ...

热度会员~~:

文強berrybkboonkiongadmin老谟深虑TaC9528huaekinteresabitchJCYSORALINc.t.teo

免责声明~~:


本站内容来源于合作伙伴及网络搜集,版权归原作者所有。如有侵犯版权,请立刻和本站联系,我们将在三个工作日内予以改正。
Email:hsbk@hotmail.com

服务与条款|隐私政策|免责声明|手机版|小黑屋|网站地图|友链申请| 文强阁

Powered by Discuz! X3.5|© 2001-2026 Discuz! Team. |本站总访问量已经运行: