网易首页 > 网易号 > 正文 申请入驻

商汤发布多模态推理大模型,可生成6万字长思维链,10秒解说视频亮点

0
分享至

AI似乎已让人陷入审美疲劳。去年12月,在OpenAI举行的ChatGPT两周年发布会上,人们并没有等来新一代大模型GPT-5,号称世界上参数最大的Grok-1也没有赢得足够的掌声。原因可能是撞上了“数据墙”。

有数据表明,互联网上可用的人类文本数据将在2028年消耗殆尽。但这并不意味着知识被耗尽,人类社会的更多知识存在于图片、声音和视频等多模态之中。

商汤技术交流日。

今天的商汤技术交流日上,商汤科技发布了“商汤日日新 SenseNova V6(简称日日新V6)”,它具备最长64K思维链、多模态深度推理、全局记忆等能力,支持10分钟的视频推理及深度推理。

“文字并非与AI交互的最终形态,更自然的交互是无处不在的多模态。”商汤科技联合创始人、大模型首席科学家林达华说。AI2.0时代的游戏规则,似乎变了。

多模态长思维链重塑AI“智力”

俗话说“一图胜千言”,许多用文字难以描述的事情,一张图就懂了。显然,声音、图片和视频等多模态是人类智能的核心要素,每个人从出生起就通过眼睛从外部世界获取知识,到了一定年龄才会去学习文字。

日日新V6的核心突破是构建出多模态长思维链。当你向它发送一段语音、一张图片或一段视频,思维链主引擎就开始工作了。它会调用商汤10年间在多模态上积累的各种能力,给出反馈并不断循环,直到输出高质量多模态长思维链。“这条思维链最长可达64K,相当于在得到答案前,大模型已思考了6万字。”商汤科技董事长兼首席执行官徐立说。

多模态对于提升大模型“智力”如此重要,但想要落地却并不容易。在预训练过程中,如果将不同数据流一股脑儿喂给大模型,容易“消化不良”。商汤掌握了不同数据流之间的桥接方法,走通了多模态预训练这条路。

另一个难点在于。视频输入相对于文字的数据量暴增。徐立表示,即使以每秒一帧的频率采集视频数量,输入量也是文字的400倍。商汤通过多维信息压缩解决了多模态视频输入的长上下文问题,率先在国内突破长视频理解的上限,可支持10分钟的视频理解及深度推理。

“日日新”模型走向“日日用”

发布会上,徐立将更多时间留给了应用场景。购物比价、店铺经营、游戏解说、文化商旅、具身智能、情感陪伴……一个个鲜活场景轮番登场,让人惊呼AI应用将深入生活的方方面面。

最大的受益群体可能是家长,因为多模态大模型可以辅导功课和讲故事了。以往AI在辅助作业方面最大的应用是拍照搜题,但这并不能让孩子学会解题思路。日日新V6能找到孩子在解题过程中出错的那个环节,并像老师一样针对错误予以讲解。

睡前给孩子读绘本也是一些家长的“必修课”,可是有些绘本文字不多,需要家长自己理解后转述给孩子。这个工作也能交给日日新V6,它拥有强大的“看图说话”能力,几张图就能编出一个有趣的故事,有时还能给出意想不到的结局。

看图说话。

视频博主的生态也将由此改变。现场展示了热门游戏《黑神话悟空》的打斗片段,日日新V6不仅能将打斗中的精彩时刻剪辑出来,还能配上解说词:“当BOSS纵身跃下,长矛划出完美抛物线,玩家立即后撤步拉开距离,这是防止被连击的核心操作……”,这一切在10秒内完成。

如果将这一能力移植到旅游,将带给人全新体验。上海西岸文化产业投资发展有限公司副总经理蔡彭菲介绍,上海西岸未来将营造AI2.0文旅体验。比如,获取信息不必扫二维码,只要将手机对准目标,AI就能自动“开讲”;将游玩时长、个人兴趣输入大模型,它会主动生成导览路线;旅游中“随手拍”也不妨扔给大模型,让它为你剪出精彩瞬间……

多模态模型迈向舞台中央

生成式AI爆发后,多模态大模型早已成为人们追求的方向。谷歌认为,只有从头开始的多模态才能构建出超越前代的先进模型。这意味着它天生地可以读取和输出不同模态内容,还具备强大的多模态推理能力和跨模态迁移能力。

这被称为“原生融合多模态技术”,被认为是AI未来发展的必由之路,也是商汤始终坚持的研发重点。林达华表示,一流企业需要有引领能力,而非紧跟热点。

2023年4月,商汤首次推出商汤日日新SenseNova大模型体系。经过5个版本迭代,去年7月推出的日日新5.5版本成为国内首个对标GPT-4o的多模态实时交互大模型,实现了语音、视频和语言模型的原生融合。日日新V6pro在多模态推理能力上相较5.5版本提升104%,纯文本能力提升55%。

自去年10月,商汤科技确立了“大装置-大模型-应用”三位一体核心战略后,其发展策略似乎变了。徐立也坦言,过去商汤的场景大多较为宏大,比如城市管理、智能工业、电网,而此次发布会则显得更有人情味。这是因为当时的模型只能针对单一任务实现闭环价值,随着大模型变得更加通用,反而让它走到更多人身边,变成“日用品”。

大模型赛道风起云涌,3个月不创新格局就会变。可以预见,手握多模态的交互入口,商汤已在AI应用新一轮爆发来临之前领先“一个身位”。

原标题:《商汤发布多模态推理大模型,可生成6万字长思维链,10秒解说视频亮点》

栏目主编:任荃 题图来源:受访者提供

来源:作者:文汇报 沈湫莎

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
扎心啊!女方直言不愿婚后成家中免费保姆,被男友怒斥是“巨婴”

扎心啊!女方直言不愿婚后成家中免费保姆,被男友怒斥是“巨婴”

另子维爱读史
2026-06-12 19:47:35
重庆一男子带茅台乘高铁被安检拦下,3分钟内豪饮整瓶,妻子回应:丈夫酒量尚可,喝完有点微醺,下车后又与朋友继续喝酒

重庆一男子带茅台乘高铁被安检拦下,3分钟内豪饮整瓶,妻子回应:丈夫酒量尚可,喝完有点微醺,下车后又与朋友继续喝酒

潇湘晨报
2026-06-12 16:20:20
金价跌破900元大关,记者实探:金店生意火爆,有人连续一个月抄底失败

金价跌破900元大关,记者实探:金店生意火爆,有人连续一个月抄底失败

上观新闻
2026-06-12 06:21:45
否决金球先生?皇马36小时闪签B席,一场静默的战术革命!

否决金球先生?皇马36小时闪签B席,一场静默的战术革命!

落夜足球
2026-06-12 13:49:58
最新!6月16日上午芜湖全市交通管制、轨道交通1号线停运45分钟

最新!6月16日上午芜湖全市交通管制、轨道交通1号线停运45分钟

最芜湖
2026-06-12 17:36:18
美银:预计美联储将放弃宽松倾向 并暗示今年不降息

美银:预计美联储将放弃宽松倾向 并暗示今年不降息

财联社
2026-06-12 22:32:12
官方:前葡萄牙国脚安德烈-席尔瓦自由身回归波尔图

官方:前葡萄牙国脚安德烈-席尔瓦自由身回归波尔图

懂球帝
2026-06-12 20:32:07
A股:股民要系好安全带,主力已经明牌了,周五将要迎来新的变盘

A股:股民要系好安全带,主力已经明牌了,周五将要迎来新的变盘

虎哥闲聊
2026-06-12 00:00:06
男人对一个女人最大的尊重,是想睡她

男人对一个女人最大的尊重,是想睡她

加油丁小文
2026-06-12 05:00:04
男子打工忘了老家还养了600只毒蝎,5年后拆迁,他回家推开门瞬间愣住了……

男子打工忘了老家还养了600只毒蝎,5年后拆迁,他回家推开门瞬间愣住了……

品读时刻
2026-06-11 09:04:59
《异度之刃》NS2升级大小翻倍!性能强大 画面不妥协

《异度之刃》NS2升级大小翻倍!性能强大 画面不妥协

游民星空
2026-06-12 21:12:47
美国男足2026世界杯新球衣公布

美国男足2026世界杯新球衣公布

体坛周报
2026-06-12 21:45:14
扎心啊!女方直言不愿婚后成家中免费保姆,被男友怒斥是“巨婴”

扎心啊!女方直言不愿婚后成家中免费保姆,被男友怒斥是“巨婴”

火山詩话
2026-06-12 06:43:48
姆巴佩伊万卡十指紧扣热恋?放大照片我笑出了声

姆巴佩伊万卡十指紧扣热恋?放大照片我笑出了声

绿茵八卦君
2026-06-10 11:40:03
世界杯大戏今晚正式开打,梅西C罗再次登场,或迎来终极绝唱

世界杯大戏今晚正式开打,梅西C罗再次登场,或迎来终极绝唱

长星寄明月
2026-06-12 18:14:42
NBA顶碗大妈演出费曝光!每场6765美元 主办方提供至少四星酒店

NBA顶碗大妈演出费曝光!每场6765美元 主办方提供至少四星酒店

罗说NBA
2026-06-12 05:53:52
网红董赤赤栽了:1300万粉丝、54万债务,她的结局比想象中惨得多

网红董赤赤栽了:1300万粉丝、54万债务,她的结局比想象中惨得多

橙星文娱
2026-06-03 11:31:20
“鹅腿阿姨”微信账号解封

“鹅腿阿姨”微信账号解封

三言科技
2026-06-12 21:42:11
15年老片突然登顶HBO Max,我盯着播放键愣住了

15年老片突然登顶HBO Max,我盯着播放键愣住了

渡川5
2026-06-11 23:08:40
2026扩招最猛的公办本科出现了!扩招数量已突破2000人!适合捡漏

2026扩招最猛的公办本科出现了!扩招数量已突破2000人!适合捡漏

高三倒计时
2026-06-12 17:22:18
2026-06-13 00:47:00
上观新闻 incentive-icons
上观新闻
站上海,观天下
500053文章数 762173关注度
往期回顾 全部

科技要闻

刚刚,人类历史上首位万亿美元富豪诞生!

头条要闻

美加墨世界杯第二场比赛就现空座 英媒:尴尬

头条要闻

美加墨世界杯第二场比赛就现空座 英媒:尴尬

体育要闻

欧洲恐韩?肉德维德?

娱乐要闻

一天4个瓜,肖战热巴最意外

财经要闻

万亿美元顺差背后,透露这些信号

汽车要闻

标配激光雷达/双动力可选 昊铂S600限时售17.99万起

态度原创

时尚
健康
家居
手机
公开课

夏天别总穿一身白或一身黑!试试一半彩色、一半基础色,高级亮眼

老人、小孩、孕妇,吃粽子有啥风险

家居要闻

空间微调 移形换境

手机要闻

vivo X Fold6再预热:天玑9500超能版+OriginOS 6 Fold

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版