网易首页 > 网易号 > 正文 申请入驻

AI看柯南2分钟揪真凶,商汤600B多模态MoE推理封神!交互记忆全线升级

0
分享至

新智元报道

编辑:编辑部 YZNH

【新智元导读】就在刚刚,商汤第六代大模型震撼升级,强推理、强交互、长记忆能力拉满。更惊人的是,这个模型彻底了实现文本、图像和视频的原生融合,看一段几分钟柯南视频,就能推断出凶手的作案手法,推理绝了!

商汤多模态大模型,刚刚震撼升级V6。

从此,日日新SenseNova V6成为真正的原生多模态通用大模型,完全实现了文本、图像和视频的原生融合。

新升级的模型,能力值简直拉满,看完几分钟的视频,能立马进行深度理解,还能给出推理分析!

比如柯南里「看不见的凶器」这集,凶手究竟是怎么下毒的?

喂一段2分多钟的视频,模型就给出了正确分析:凶手大概率是通过妻子每日开的车进行间接投毒的。

在分析中,它甚至直接猜出了关键线索——凶手很可能是将毒药涂抹在了空调系统管道中。

我们特意去名侦探柯南的动画中考证了一番,模型给出的,就是正确答案!

甚至,它还能自动变成「剪刀手」,帮我们剪辑出想要的视频片段,还给出搭配bgm的建议。

比如给它一段《黑神话·悟空》的经典雪地打斗片段后,它就会根据要求剪出「精彩的闪躲」高光时刻,甚至为每个片段都配上了解说文案。

「欢迎来到黑神话悟空的战斗世界,当boss从飞檐纵身跃下,注意他长矛划出的完美抛物线。」这文案实在太地道了。

在图像理解与推理方面,它可以正确地总结出斯坦福HAI「2025 AI Index」报告中图表的内容,包括这一年顶尖大模型的性能趋于相近,以及竞争激烈的现象。

同时,它还总结出了各大模型的动态规律,以及隐含意义,点出下一阶段的决胜关键,就是差异化功能、垂直场景应用。

在音频通话中,我们可以随时打断它,它接得住各种类型的话茬,还能用开心、沮丧等各种情绪和我们说话。

它可以情绪饱满地读一首《满江红》。

手头晦涩的英文资料,也可以请它帮忙给出介绍了,比如DeepSeek这篇论文的摘要,它看一眼就可以帮忙给出总结。

而且,这个600B的MoE模型不仅解锁了「强推理、强交互、长记忆」的超强能力,还实打实地横扫了各类榜单。

在纯文本和多模态任务上,它在多项指标上超越了GPT-4.5、Gemini 2.0 Pro,甚至全面碾压DeepSeek V3。

从此,SenseNova V6瞬间解锁更多高级场景,再次大大拓宽大模型的应用边界!

多模态「全能王」诞生

2025的AI舞台,依旧硝烟弥漫。

单纯堆砌参数的Scaling Law正走向尽头,效率、多模态、推理能力成为了全新的竞技场。

从GPT-4.5、Gemini 2.5 Pro到刚刚发布的Llama 4,全球顶尖玩家都在加码多模态融合,而商汤也以「日日新SenseNova V6」系列,强势杀入这场王者之战。

综合来看,业界大模型竞争已从量变转向质变,三大趋势清晰可见:

  • 效率为王,参数边际收益越来越小,业界不再盲目扩大参数量,而是转向模型架构创新和高密度数据合成,提升 scale斜率。

  • 多模态登顶,信息融合成为核心。文字、图像、视频不再是割裂输入,而是通过深度融合,带来更完整的场景价值。

  • 深度推理能力成焦点,更是AI切入高价值场景的关键。过去,推理多停留在数理求解任务上,但未来,它必须与多模态结合,才得以应对真实世界的复杂挑战。


原生多模态融合,三点全面突破

商汤敏锐地捕捉到这三大技术走向,以此为蓝图,才打造出SenseNova V6系列,剑指三大技术高地——

多模态长思维链、多模态强化学习、多模态全局记忆

在他们看来,真正有价值的大模型,必须要做到两点:一是能融入真实业务,解决复杂问题;二是能与人自然交互,让人愿意持续聊天。

接下来,就让我们解剖SenseNova V6,看看这款模型凭什么敢挑战全球顶尖?

基石王者:SenseNova V6 Pro/Reasoner Pro

SenseNova V6 Pro是原生多模态通用大模型,共有6000亿参数,采用了MoE架构,原生融合了文本、图像、视频元素,综合性能全面开花。

在纯文本和多模态任务上,SenseNova V6 Pro性能直逼Gemini 2.0 Pro和GPT-4.5。

推理版Reasoner Pro在SenseNova V6 Pro的基础上,通过多模态长CoT训练和多模态增强学习,推理能力大幅提升。

相较于上一代SenseNova 5.5,Pro推理版多模态融合能力更强。

甚至,它能够对标OpenAI o1和Gemini 2.0 Flash-thinking,轻松破解多模态复杂任务。

此外,SenseNova V6还有面向实时交互、视频理解等场景的小版本。通过深度融合了语言、语音、视频,支持视频-语音端到端实时交互,综合性能直接对标GPT-4o mini,但共情能力和情感语音交互更胜一筹。

四大技术创新

SenseNova V6的耀眼表现,背后是商汤多年技术积累的爆发。

2025年1月,商汤融合模型拿下了SuperCLUE 2024年语言模型综合榜和OpenCompass多模态综合榜国内第一。

这恰恰验证了,原生多模态融合训练技术的巨大潜力。

如今,他们技术沿着这条路线持续优化和scale,SenseNova V6的性能得以再上新的台阶。

面对复杂问题,SenseNova V6能够像人类一样深度思考,一步步推理出答案,正是因为其采用了多模态长思维链合成技术。

通过多智能体协作,进行长CoT合成和验证,最终实现了64K多模态长思维链,让模型具备长思考能力。

此外,商汤还构建了面向多种图文任务「混合增强学习」框架,融合了RLHF和RFT,动态去调节主客观表现。

这样一来,SenseNova V6在推理能力提升的同时,情感表达也不会打折。

SenseNova V6能够处理10分钟视频,因其将视觉信息(画面)、听觉信息(语音、音效)、语言信息(字幕、口语)、时间轴逻辑进行对齐,形成了统一表征,再通过动态压缩保留了关键语义。

由此,10分钟视频被大幅浓缩到16k token,既高效又精准,为长视频理解开辟了全新格局。

看得出,SenseNova V6的诞生,是商汤多年来技术的集大成。

更重要的是,它并没有停留在实验室,已经在企业助手、机器人等交互场景中落地开花。

从办公神器到机器人,「日日新」日日用

如今,全新SenseNova V6多模态大模型正在解锁一系列令人惊叹的应用场景。

从打工人效率神器,到深耕日常场景智能助手,再到赋予机器人「灵魂」,V6正用技术温暖生活。

AI的价值在于解决日常中的繁琐与痛点,让技术真正服务于人。

正如商汤科技创始人徐立所言,「AI之道,在于百姓之日用」。接下来,让我们一探究竟,V6如何走进每个人生活。

打工人神器,效率倍增

在办公领域,SenseNova V6再次赋能商汤AI超级助手——办公小浣熊。

它是一个将LLM融入规划、数据分析、文档编辑的办公助手,通过Plan-Analyze-Write三步法,重塑工作流。

举个栗子,让AI帮你去分析餐厅评论数据,不到1分钟时间,小浣熊就给出了完整建议。

在输出内容左下角,还有「创建一个新文档」选项,不用跳出网页端,便可在一键生成的内容上,与AI再次共创。

针对开发者,还有专门的代码小浣熊,能让编码效率蹭蹭提升。

它覆盖了软件需求分析、架构设计、代码编写、软件测试等多个环节,可以实现代码编写、编程学习等各类需求。

关键是,它还能支持Python、Java、JavaScript等100+编程语言,兼容VS Code、JetBrains系列等主流IDE。

假设上传一份产品需求文档,然后要求写一个公有云上微信扫码订单模块,AI会迅速给出解决方案。

具体来说,它的主要功能包括智能代码补全、AI代码对话、代码编辑、多模态软件研发、面向企业级BizDevOps提供全面智能辅助等。

使用代码小浣熊后,开发者的开发效率提升了50%+,企业的研发效率提升了30%+

此外,在商业保险核赔中,传统财务人工审核往往耗时3-7天,且规则杂难以完全定义。

日日新V6通过学习海量数据,便能迅速发现单据中存在的问题,大幅提升了效率并降低错误率。

比如下面这个例子,V6就检查出上传的凭据金额不符、时间矛盾,并且还有处方药的单子需要补全。

不仅如此,它还发现了一些非常细节的瑕疵——体重没填、医生也没有签名等等。

而这一系列风险的提示,都是V6自己进行交叉验证之后获得的。

再比如,一家咖啡店收集了用户各种反馈,V6通过多模态分析后,能生成SWOT报告,指出推广潜力并给出具体方案。

记账购物,节支小帮手

不仅如此,「日日新」多模态大模型正深入到普通人的每个生活场景中,让AI变得更加触手可及。

就比如,大多数人会记账,那么AI加持的记账,又会有何不同呢?

「咔皮记账」,这款聚焦于消费和财务管理的工具,采用了Multi-Agent模式,通过「分时动态推理」灵活分配资源,精准响应需求。

比如,MBTI消费分析报告这个功能,就把游戏趣味和专业分析结合了起来。使用时不仅能看到表达高度自由的思维链,而且任务生成的网页也是实时渲染的。

另一大常见的场景,便是上网购物了。

面对不同平台上五花八门折扣信息,难以快速对比快速抉择,不如就交给AI。

这时,难点来了——各个平台的布局,差异极大。

比如关于打折的信息,有的写在黄色的背景上,有的写在蓝色的背景上,还有的则是跟在其他文字的后面。

更麻烦的是,包装的规格也不尽相同:有80抽16包,有60抽5包的,还有110抽12包的。

对此,V6不仅能综合分析商品价格、包装、促销等信息,甚至还可以细化到「每抽纸巾的单价」,推荐出最优购买方案。

不论是账,还是购物,省钱也有了小技巧。

机器人有了「灵魂」

在机器人领域,SenseNova V6,让它们不仅让能「看」清环境细节,「听」懂你的指令,「说」出自然流畅的回答,甚至通过推理,还能读懂你的情绪。

更厉害的是,V6能够做到让机器人语言和动作同步,比如讲解时,它会一遍娓娓道来,一边用手势表达;或是对情绪感知后,做出肢体反应的动作。

商汤用AI让机器人不再是冰冷冷的工具,而是生活中智慧又贴心的伙伴,开启了人机交互新时代。

无论是管理需求、教学辅助,还是销售报告,V6均能处理非结构化数据,应对开放式问题。

我们可以看到,商汤多模态大模型,正以「百姓之日用」为导向,让AI从仰望星空的宏大叙事,落地成为每个人生活中的得力助手。

AI 2.0未来引擎,三位一体

当下,AI正以惊人的速度重塑世界。

在这场AI 2.0变革中,商汤并没有选择了单打独斗,而是祭出了「大装置-大模型-应用」三位一体的核心战略。

这不仅仅是一场技术的协同进化,更是对AI未来的深刻洞察——

基础设施是大模型的「根基」,大模型是应用的「引擎」,而应用场景又会反哺技术迭代,形成一个生生不息的生态闭环。

商汤的目标很明确,既要做「最懂算力的大模型服务商」,也要做「最懂大模型的算力服务商」,用硬实力驱动AI落地开花。

他们以「日日新」多模态大模型为基石,正加速「一基两翼」的布局。

生产力工具为企业插上了效率的翅膀,从金融分析到政务管理,让打工人工作不再繁琐,效率成倍提升。

而交互工具则带来温暖的智能体验,无论是智能陪伴还是个性化营销,AI皆可得心应手。

这种润物细无声的渗透,才是AI 2.0的真正意义。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
带娃出国的中产后悔了:想回来,但回国失败

带娃出国的中产后悔了:想回来,但回国失败

视觉志
2026-03-24 10:36:13
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
旧手机回收价狂涨五六倍!回收商:开不了机的照样高价收

旧手机回收价狂涨五六倍!回收商:开不了机的照样高价收

快科技
2026-03-25 14:53:24
东契奇43分创纪录,湖人逆转胜步行者稳西部第三

东契奇43分创纪录,湖人逆转胜步行者稳西部第三

李絙在北漂
2026-03-26 13:20:36
51岁孔令辉:为生活奔波,与刘国梁9年未见面,一个电话让他落泪

51岁孔令辉:为生活奔波,与刘国梁9年未见面,一个电话让他落泪

梦史
2026-03-25 11:33:08
王励勤动真格了!伦敦世乒赛阵容有变,陈梦调整,2人被冷落

王励勤动真格了!伦敦世乒赛阵容有变,陈梦调整,2人被冷落

不似少年游
2026-03-25 17:03:59
你知道我在床上有多厉害吗?

你知道我在床上有多厉害吗?

果粉之家
2026-03-20 12:35:16
从欧尔班行为,看北约当年拒绝俄罗斯的远见

从欧尔班行为,看北约当年拒绝俄罗斯的远见

民间胡扯老哥
2026-03-23 18:53:38
破防!小县城殡仪馆大屏流出,中年人扎堆离世,网友:还争什么?

破防!小县城殡仪馆大屏流出,中年人扎堆离世,网友:还争什么?

川渝视觉
2026-03-23 19:26:44
丧夫仅5个月,49岁翁帆突传“喜讯”高调露面,状态好到出人意料

丧夫仅5个月,49岁翁帆突传“喜讯”高调露面,状态好到出人意料

冷紫葉
2026-03-24 19:12:36
勇士逆转横扫送篮网9连败 桑托斯31分大爆发波杰姆斯基22分

勇士逆转横扫送篮网9连败 桑托斯31分大爆发波杰姆斯基22分

醉卧浮生
2026-03-26 12:45:06
第六险来了!一文读懂“长护险”

第六险来了!一文读懂“长护险”

极目新闻
2026-03-26 07:21:00
张雪峰猝死后,卢克文也不敢跑步了,曾每年跑1千公里,身体垮了

张雪峰猝死后,卢克文也不敢跑步了,曾每年跑1千公里,身体垮了

水晶的视界
2026-03-26 09:28:29
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
四川高县村支书暴打残疾村妇致轻伤 法院判决免于刑事处罚引争议

四川高县村支书暴打残疾村妇致轻伤 法院判决免于刑事处罚引争议

律法刑道
2026-03-26 10:55:03
2.4亿成全你!詹姆斯降薪2000万?双詹合体咋办!

2.4亿成全你!詹姆斯降薪2000万?双詹合体咋办!

柚子说球
2026-03-25 11:44:10
萨巴伦卡赢郑钦文后吃100美元汉堡 顶奢!鱼子酱+金箔碎她说超好吃

萨巴伦卡赢郑钦文后吃100美元汉堡 顶奢!鱼子酱+金箔碎她说超好吃

劲爆体坛
2026-03-26 08:10:23
4000吨稀土被转运美国?大陆停供台湾稀土!台学者:不如直接统一

4000吨稀土被转运美国?大陆停供台湾稀土!台学者:不如直接统一

小舟谈历史
2026-03-19 17:27:44
RMC记者:姆巴佩在发布会上说谎了,我1000%确认他被误诊了

RMC记者:姆巴佩在发布会上说谎了,我1000%确认他被误诊了

懂球帝
2026-03-26 06:43:05
伊拉克民兵无人机出击!炸了美军的雷达,又击中黑鹰直升机

伊拉克民兵无人机出击!炸了美军的雷达,又击中黑鹰直升机

战风
2026-03-25 11:44:25
2026-03-26 13:55:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14819文章数 66720关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

艺术
游戏
数码
房产
公开课

艺术要闻

哪一座桥不是风景?

IGN认为Xbox机会来了!新主机要转守为攻 重塑自我

数码要闻

Intel史上最先进!酷睿Ultra 300系列vPro平台发布

房产要闻

质价比标杆!三亚首创浮岛全景舱亮相,还得是万科!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版