网易首页 > 网易号 > 正文 申请入驻

大模型卷不动了吗?商汤给出了新答案

0
分享至

作者 | 周一笑
邮箱 | zhouyixiao@pingwest.com

在今年世界人工智能大会上,一个颇为引人注目的场景,主角是一个人形机器人。它独自站在台上,自主讲解着一份关于唐代荔枝运输史的PPT。

根据商汤科技董事长兼CEO徐立在“大爱无疆·模塑未来”大模型论坛上的介绍,这个机器人不仅语言风趣,能自行控制PPT翻页,甚至可以在回答完台下观众的提问后,无缝衔接回自己原来的讲稿。这种流畅度,已经超出了简单程序控制的范畴,更像一个具备了初步理解和记忆能力的讲解员。

这看似轻松的演示,背后恰恰是当前AI领域的核心难题,如何让视觉理解、语言生成、情境记忆、人机交互等多种能力无缝协作。正是这种对综合能力的更高要求,促使行业开始重新审视过去几年的主流发展路径。

过去几年,行业一度信奉“大力出奇迹”的路径。但在2025年的今天,这条路正面临清晰的边界。正如行业普遍观察到的,互联网高质量文本数据将在未来几年内耗尽,其增速已远落后于算力增长;同时,真实环境下的主动交互数据采集成本极高,成为了具身智能发展的核心瓶颈。单纯“堆料”的模式,显然已不足以支撑AI的持续进化。

这正是商汤这家公司的特殊之处,作为一家在计算机视觉领域深耕了十年的公司,商汤的基因决定了它对世界的理解始于图像和视频。在生成式AI时代,商汤并未将自己局限在纯语言模型的竞赛中,而是选择了一条更契合自身历史基因的道路。根据其领导层在多个场合的阐述,商汤当下的核心战略,是利用其深厚的视觉理解能力,将公司定位在多模态基础模型及其在具身智能等领域的应用之上。

1

多模态的新故事:当行业觉得“卷不动”时

多模态这个概念在行业里已被讨论多年,各家都在布局,以至于很多人觉得这已是一个重要但缺乏新突破的领域。然而,商汤提出了一个更具挑战性的想法:要实现更高阶的智能,AI的多模态能力需要再往前走一步,从信息的“融合理解”深入到“动态思考”的核心。

在与我们的交流中,商汤科技联合创始人、执行董事、首席科学家林达华阐述了这意味着什么。他认为,AI的思考过程不应是纯文本的,而是应该能不断生成新的图像进行推演,这便是“图文交错的思维链”。

要走通这条窄门,挑战巨大。首先是数据,能体现人类思考过程的数据天然是稀缺的。商汤的解法之一,是以少量专家数据为种子,用AI为AI造出大量包含推理过程的合成数据,以提升训练数据的“思维密度”。

其次是成本。为了在控制成本的同时实现复杂推理,商汤在这次发布的日日新6.5多模态大模型上,对架构进行了创新。其模型体系采用了超过6000亿参数的混合专家(MoE)架构。林达华在采访中提到,他们采用了一种“更扁平的视觉编码器搭配更纵深的语言模型中枢”的新设计,让模型“视觉上敏捷,思考上有深度”。根据公布的数据,新架构使得性价比提升了三倍,推理成本只有原来的30%。一个150亿参数的轻量模型,性能已能在多数维度上达到过去6000亿参数模型的95%。

1

宽路:从Agent到物理伙伴

一个更强大、更高效的模型,最终要通过Agent来体现价值。商汤的Agent家族小浣熊,其核心应用之一便是处理复杂的数据分析任务。

现实世界中的Excel表格,往往充满了合并单元格、多个子表和混杂的图文,是典型的多模态难题。在一个头部客户的实际测试中,面对这类任务,小浣熊的表现比当时更新的DeepSeek模型,依然有十分左右的优势。这种在关键应用上的性能差异,直接体现了其底层模型在强推理能力上的不同。

商汤对Agent的构想,并不局限于小浣熊这样的数字Agent形态。在今年的WAIC展区,商汤展示了一个由众多硬件伙伴构成的应用生态,包括元萝卜下棋机器人、小米AI眼镜,以及来自钛虎、傅利叶等公司的人形机器人。

当然,打造一个开放的硬件生态也并非易事。相比苹果或特斯拉那种软硬一体、高度垂直整合的模式,平台赋能的路线需要解决生态伙伴技术水平参差不齐、最终用户体验难以完全统一等问题。

商汤在其中扮演的是核心技术提供者的角色。林达华在采访中解释了硬件厂商选择合作的原因:大部分硬件厂商,特别是智能玩具等消费电子公司,对成本高度敏感,因此并不具备自研顶尖交互模型的能力。商汤提供了一个它们亟需的、开箱即用的智能大脑。至此,商汤的Agent战略版图变得清晰:以小浣熊这样的数字Agent深入企业的生产流程,再以赋能硬件的物理形态进入人们的日常生活。

1

一场需要“沿途下蛋”的马拉松

从Agent到机器人,再到让它们与物理世界交互,商汤的布局也自然地延展到了具身智能这一前沿领域。这次WAIC上,商汤正式发布了“悟能”具身智能平台 。该平台以商汤的具身世界模型为核心,旨在为机器人等终端提供强大的感知、导航和交互能力 。徐立展示的“在真实世界开极品飞车”的Demo,就展示了其“开悟”世界模型在生成高保真、可交互场景方面的能力 。

对未来的想象和布局上,也让我们看到了AI巨头们理解上的差异。谷歌DeepMind的领导者德米斯·哈萨比斯在近期一次广为流传的播客访谈中构想,AGI的终极体现是破解聚变能源、模拟完整细胞,解决人类最根本的科学挑战。

在林达华看来,真正意义上的Intelligence——智能的定义,就是一个智能体或者“人”它跟这个世界自主交互的能力。而这里面包括很多不同的维度,比如感知、推理、决策等等。商汤的路径,是先让AI成为能读懂财报、看懂图纸、帮你规划旅行的得力助手。一个看似仰望星空,一个似乎脚踏实地。但后者的路径,恰恰是离当前企业和用户的真实痛点最近,也是最快能创造商业价值的领域。

在中长期战略上,商汤的思考倾向于在把基础模型做好的同时,打造很多个能深入场景变革生产力、重塑工作范式的专业Agent,互相形成组合,最终实现可持续的商业闭环,而非一个什么都能干的“超级智能体”。因为后者的成本在真实商业场景中可能难以承受 。另一个,就是与合作伙伴一起推动像具身智能的发展。

这种选择的背后,是商汤对AGI发展路径的核心判断,它不是一场百米冲刺,而是需要付出很长时间和努力的长跑。

在这场艰苦的竞赛中,一时的技术突破固然重要,但能否跑到最后,更在于能否建立一个可持续的商业闭环 。商汤的策略,被林达华在采访中概括为“沿途下蛋” 。即在追求AGI这个远大目标的过程中,必须在沿途不断创造出能自我造血的商业价值。无论是小浣熊,还是硬件生态,都是商汤在长跑路上“生下的蛋” 。它们不仅能为研发提供资金反哺,更能让技术在真实应用中获得最宝贵的反馈。

这种务实的哲学,并非凭空而来,而是源于商汤过去十年在AI浪潮起伏中的经验沉淀。一家经历过技术hype与现实挑战的公司,对什么是真正有价值的东西,会形成自己的判断。林达华在采访结尾的一句话,或许能作为注脚:“AI行业之所以曾出现过冬天,就是因为技术无法落地,人们用不上,它就失去了价值” 。

从WAIC上那个会讲PPT的机器人开始,我们所看到的,是一个多层战略的物理体现,一条对多模态认知的技术窄路,一个软硬一体的商业宽路,以及一个为跑赢AGI马拉松而设计的、可持续的发展哲学。

点个爱心,再走 吧

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
顾客不满下单后等26分钟,辱骂推搡女服务员并撂狠话“在我老家,砸死你”;警方:对方拒道歉,将依法处理

顾客不满下单后等26分钟,辱骂推搡女服务员并撂狠话“在我老家,砸死你”;警方:对方拒道歉,将依法处理

大风新闻
2026-02-07 17:14:08
滑雪运动员向阴茎注射玻尿酸,通过增大阴茎获得更大尺寸的滑雪服来提升比赛表现

滑雪运动员向阴茎注射玻尿酸,通过增大阴茎获得更大尺寸的滑雪服来提升比赛表现

观威海
2026-02-07 15:46:07
绝地反击!中国队让二追三逆转韩国晋级羽毛球亚锦赛男团决赛

绝地反击!中国队让二追三逆转韩国晋级羽毛球亚锦赛男团决赛

懂球帝
2026-02-07 22:46:10
撞上火车头!立陶宛新总理认怂:美台承诺全是假,我们栽惨了

撞上火车头!立陶宛新总理认怂:美台承诺全是假,我们栽惨了

局势帝
2026-02-07 17:36:25
警惕中国式的叶利钦式人物,悄无声息地把人民引向歧途

警惕中国式的叶利钦式人物,悄无声息地把人民引向歧途

林子说事
2026-02-06 12:52:37
下套不成反被将一军,共和党拒绝公开听证会,克林顿夫妇不忍了

下套不成反被将一军,共和党拒绝公开听证会,克林顿夫妇不忍了

东极妙严
2026-02-07 13:47:16
当下的经济困局,根本不是外部打压

当下的经济困局,根本不是外部打压

流苏晚晴
2026-02-07 17:04:52
联合国新秘书长人选出炉?对华态度不一般,中国反而很淡定

联合国新秘书长人选出炉?对华态度不一般,中国反而很淡定

东极妙严
2026-02-07 13:46:11
有没有发现一个怪像?美国绑架马杜罗已有一个月,现在已没人提了

有没有发现一个怪像?美国绑架马杜罗已有一个月,现在已没人提了

南权先生
2026-02-07 15:56:33
诺奖无用论广为流行,我们正在进入晚清时代2.0?

诺奖无用论广为流行,我们正在进入晚清时代2.0?

枫冷慕诗
2026-02-07 09:15:10
炸裂!山东夫妇到美国帮女儿带孩子,5年后连带女儿遭洋女婿杀害

炸裂!山东夫妇到美国帮女儿带孩子,5年后连带女儿遭洋女婿杀害

谈史论天地
2026-02-07 08:40:06
外卖大战后,又一补贴大战来了

外卖大战后,又一补贴大战来了

有意思报告
2026-02-06 16:19:40
谁碰中巴项目灭谁?瓜达尔港遇袭,48小时击毙177人,中方4字回应

谁碰中巴项目灭谁?瓜达尔港遇袭,48小时击毙177人,中方4字回应

夕阳渡史人
2026-02-07 11:06:45
天助阿森纳,1-1爆大冷门,英超第3遭英超第12逼平,落后榜首9分

天助阿森纳,1-1爆大冷门,英超第3遭英超第12逼平,落后榜首9分

侧身凌空斩
2026-02-08 01:28:25
大跌眼镜——俄军空袭乌方导弹命中率首次为0

大跌眼镜——俄军空袭乌方导弹命中率首次为0

史政先锋
2026-02-07 20:38:56
震撼!爱泼斯坦死亡当晚监控橙色人影曝光!与美女嬉闹亲子鉴定视频流出!

震撼!爱泼斯坦死亡当晚监控橙色人影曝光!与美女嬉闹亲子鉴定视频流出!

魔都囡
2026-02-07 07:12:47
员工年会抽中苹果手机变瓷砖后续:老板补发真机,主谋下场尴尬

员工年会抽中苹果手机变瓷砖后续:老板补发真机,主谋下场尴尬

观世记
2026-02-07 16:24:51
明珍珍被执行死刑,最后照片曝光,死前已无法自理

明珍珍被执行死刑,最后照片曝光,死前已无法自理

复转这些年
2026-02-05 23:51:59
米兰冬奥会开幕式争议:乌克兰获热烈欢呼!以色列亮相遭巨大嘘声

米兰冬奥会开幕式争议:乌克兰获热烈欢呼!以色列亮相遭巨大嘘声

念洲
2026-02-07 07:46:06
巴萨发布官方公告 宣布退出欧超联赛

巴萨发布官方公告 宣布退出欧超联赛

体坛周报
2026-02-07 19:36:38
2026-02-08 05:03:00
硅星人 incentive-icons
硅星人
硅(Si)是创造未来的基础,欢迎来到这个星球。
2847文章数 10436关注度
往期回顾 全部

科技要闻

小米千匹马力新车亮相!问界M6双动力齐报

头条要闻

网购椅子多出15公斤银砖 男子紧急报警

头条要闻

网购椅子多出15公斤银砖 男子紧急报警

体育要闻

主队球迷唯一爱将,说自己不该在NBA打球

娱乐要闻

金晨处罚结果曝光!肇事逃逸被罚款

财经要闻

金价高波动时代来了

汽车要闻

工信部公告落地 全新腾势Z9GT焕新升级

态度原创

艺术
亲子
手机
数码
公开课

艺术要闻

这些女性在俄罗斯摄影师镜头下,魅力四射!

亲子要闻

深圳龙岗妇幼成功实施“臀位外倒转术”助产妇顺产

手机要闻

华为苹果领衔 TOP5厂商入场,阔折叠方向对了吗?

数码要闻

冠捷推出26.5英寸AOC G4白色显示器:LGD四代WOLED,2919元

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版