Just now, DeepSeek has a big update! Finally "opened my eyes" | Attached is a large number of actual measurements
刚刚,DeepSeek大更新!终于“开眼”了|附大量实测
凤凰网科技
ifeng
Document Text
1,755 characters
原以为这个疯狂的 AI 疯狂更新应该已经告一段落了,没想到上周才发完 V4 的 DeepSeek ,突然端出一个更大的惊喜。<br>
就在刚刚, DeepSeek 上线了识图模式,显示正在灰测中。这意味着讨论了一整年的 DeepSeek 多模态能力,终于来了!<br>
目前 DeepSeek 网页版和 App 更新后都有可能被灰测到识图模式,APPSO 第一时间给大家进行了实测。<br>
DeepSeek 负责多模态的研究员陈小康在 X 上发文: Now, we see you,并配上了一张图,我们就让 DeepSeek 来解读一下这张图何意味。<br>
结果显示,它能识别出这张图背后的隐喻,虽然图中没有任何关于DeepSeek 的字眼,但它结合对发布者身份和图像的识别,推断出这是关于 DeepSeek 多模态能力的更新。<br>
最后给出一句十分到位的总结:那个看不见世界的鲸鱼,现在终于睁开眼了。<br>
比起回答结果,APPSO 发现 DeepSeek 识图模式的思考过程更有意思。<br>
上下滑动查看完整思考过程<br>
过去 AI 来看那张推特截图,大概率是老老实实描述:「两只蓝色鲸鱼,左边戴眼罩,右边没戴。」<br>
但 DeepSeek 它上来就开始追问:这人是谁?他为什么发这个?鲸鱼 logo 代表什么?眼罩上的 XX 又在暗示什么?<br>
这才是我们刷到一张梗图时脑子里真正发生的事。没人会先数鲸鱼有几只,我们关心的是谁在对谁说话,说的是什么潜台词。<br>
而且它还会来来回回的自我纠正。<br>
比如它甚至一度把图中的眼罩联想到《天元突破》里卡米那的眼镜,然后自己打脸: 「不,这太宅男向了。」「等等,仔细看……」 「再换个角度……」 。<br>
前面那些推理、联想、自我纠正,都挺精彩。但整段思考过程里最反常识的部分,其实是它推理到快收尾时,突然自己喊了个暂停,给自己开了一场小型答辩会。<br>
它列出三个问题自问自答,先确认客观事实,再推测事件性质,最后才做解读。 DeepSeek 把这个我们自己都没意识到的思维习惯,做成了识图的思考逻辑。<br>
就像我们平时给结论之前,脑子里也会过一遍:「等等,这个前提对吗?那个假设站得住吗?万一我理解错了方向呢?」<br>
我们还把经典的 AI 测试题——数手指,抛给了 DeepSeek。<br>
它思考了一通,还是回答错了,中间还吐槽了一句:「我真的是数晕了。」<br>
不过如果我再引导一下,它还是可以回答正确。<br>
另外一个数手指的测试中,第一次回答错误之后,我没给答案,只是让它再想想,也能给出正确的回答。<br>
我们还试了试一个经典的「爱心」测试,这个图之前难倒了所有 AI , DeepSeek 同样没有能识别出来。<br>
抛开这些难度较高的极限测试,APPSO 初步测试下来,DeepSeek 识图的准确率其实还是比较高,不开思考模式的话甚至半秒就能给出回答。<br>
比如这个电影剧照的识别,应该是已经在数据库内了。<br>
对于抽象图片的理解也十分到位。<br>
优衣库这个商品图的理解也没有问题。<br>
不过这个识图的过程应该是没有联网搜索,只能基于知识库回答,所以一些比较新的东西,就无法识别,比如苹果这个新的吉祥物 Finder 酱。<br>
而且识图模式上传的文件格式也有限制,比如不支持 HEIF 格式<br>
DeepSeek 识图模式上线,意味着这只鲸鱼终于开眼了,但也许只是刚刚开始。<br>
DeepSeek 多模态更多的能力可能很快也会陆续更新,补上这块短板后,整个国产模型的格局可能也会再次迎来微妙的变化。<br>
APPSO 将持续跟大家分享 DeepSeek 识图模式更多的体验,也欢迎大家体验后与我们分享有意思的小技巧和细节。<br>
“特别声明:以上作品内容(包括在内的视频、图片或音频)为凤凰网旗下自媒体平台“大风号”用户上传并发布,本平台仅提供信息存储空间服务。<br>
Notice: The content above (including the videos, pictures and audios if any) is uploaded and posted by the user of Dafeng Hao, which is a social media platform and merely provides information storage space services.”
Metadata
| Publisher | 凤凰网科技 |
| Site | ifeng |
| Date | N/A |
| CMS Category | 媒体报道 |
| Keywords | 鲸鱼 模式 过程 模态 图像 国产 事件 苹果 无法 大家 体验 世界 整段 常识 结果显示 大量 男向 意识 脑子里 测试题 经典 电影 商品 细节 意味 原以为 太宅 思维习惯 结论 手指 爱心 剧照 优衣 技巧 张图何 模型 身份 格局 发布者 能力 眼罩 代表 上线 客观事实 性质 研究员 小康 吉祥物 东西 总结 精彩 部分 推断出 短板 睁开眼 蓝色 先数 联网 时间 格式 |
Verification