网易首页 > 网易号 > 正文 申请入驻

模型之问|“上海队”该如何保持领先?

0
分享至

转载自:解放日报


■“大模型发展至今,已经不是一个单纯的技术问题,也不再是单家公司做某一款产品的问题,而是需要共同创造一个社区,以通往agi的未来。生态发挥着重要作用。”

■国产模型与国产算力之间,正在加速双向奔赴。未来模型对推理算力的需求,将是训练算力的百倍甚至千倍。与此同时,算力基础设施正在走向系统化,相关的软硬件技术,已不再是芯片公司单独可以完成,而是需要跨行业的协作,多方聚力,构建系统化解决方案

纯语言模型的能力或触顶,多模态融合才可能最终通往agi(通用人工智能)?在专注基模研发和商业落地agent(智能体)之间,该如何抉择?除了从闭源走向开源,大模型产业界在生态协同上还能做些什么?

今年世界人工智能大会的重大创新,在于切中数学、科学、模型要害,提出“ai三问”。昨天,由商汤科技承办的一场大模型论坛,邀请来自阶跃星辰、上海人工智能实验室、第四范式、智谱等大模型公司的大咖进行技术交流,“模型之问”贯穿始终。记者发现,在这场基本集齐上海“四大基模”的现场,大模型“上海队”的抉择凸显出它们“留在牌桌上”的暂时领先优势。

全球出圈

自chatgpt在2022年11月30日一夜爆火后,大语言模型厂商们在对标路上狂奔两年多。然而它们所有的努力,几乎被今年初发布的deepseek-r1抹平。

好在行业反转很快出现。权威机构预测,语言模型将在2028年耗尽人类文本数据。与此同时,deepseek-r1等语言大模型不时传出边际效益递减的问题。基于此,业内愈发意识到,多模态大模型可能是迈向agi的入场券。为此,openai、谷歌、meta等科技巨头陆续发布了gpt-4.5、gemini 2.5 pro、llama 4等多个性能强大的多模态基模。

但巨头们没想到,今年以来,来自上海的多模态大模型此起彼伏地出圈。

如成立于2014年的商汤科技,以计算机视觉起家,近两年果断进行大模型技术革新,是极少数能迅速转弯、从视觉算法跨越到大模型技术周期且保持算法领先的ai公司。今年4月,商汤发布新一代6000亿参数多模态大模型“日日新v6”,其多模态综合能力看齐gpt-4.5,局部还有超越,并且率先引入长思维链,将多模态与深度思考结合起来。比如,面对四张描绘“乌龟羡慕长颈鹿脖子长”的连环画,“日日新v6”能完整讲述故事,并在结尾升华为“长颈鹿有它的优势,但你也有你的价值”。

短短三个半月后,商汤在此次大会上发布“日日新v6.5”。商汤科技董事长兼ceo徐立说,相比v6版本,“日日新v6.5”的强化学习效率增加了40%,性价比提升了三倍,使模型应用有了更大利润空间。“以单年维度看,一年内模型推理成本大幅度下降大有可能。”

取得如此成绩,需要底层架构、高质量数据清洗、上层算法的整体创新。

相比积淀深厚且迅速转向的上海老牌ai公司,不到4岁的minimax和刚满2岁的阶跃星辰,则在创业之初就锚定多模态。

如阶跃星辰,坚信多模态是通往agi的必经之路,2023年4月成立迄今,已发布基模超过20款,且多模态占比70%,是业内公认的“多模态卷王”。7月25日,阶跃星辰发布其新一代基模step 3,拥有强大视觉感知和复杂推理能力。比如,能敏锐识别图中隐蔽的字母;又如,即便菜单反光严重,仍能准确还原菜单内容;再如,结合微信群聊天记录,输入购物小票,模型即能聪明计算aa制消费分摊。

而6月,上海独角兽企业minimax则发布了全球首个开源大规模混合架构推理模型——minimax-m1,目前在权威评测榜单已位列全球开源模型第二;minimax同期发布的视频生成大模型hailuo 02,因实现了对物理世界规律的极致理解,可直接叫板谷歌第三代视频生成模型veo3。过往ai视频模型中难以解决的体操、杂技等复杂运动中常出现的运动主体肢体错乱、五官扭曲等“翻车”状况,在hailuo 02中都被消灭。目前,minimax视频生成应用hailuo ai已力压海外的sora、runway等产品,持续保持全球第一,并帮助200个国家和地区的创作者生成了超过3.7亿个视频。

晒“朋友圈”

尽管高频出圈,仍要面临选择:是向左,持续投入基模研发,还是向右,快速构建商业闭环?对于这样的问题,无论是来自北京的智谱、第四范式,还是大模型“上海队”,都有相同态度——既要又要。

正如智谱华章科技股份有限公司总裁王绍兰所言,持续的基模研发,关乎决心。“但如果大模型一直做纯理论研究而不做商业化落地,怎么证明大模型真正改变产业呢?”

事实上,迫于内部成本与外部竞争,国内外大模型公司无不在加速收敛。国内百模大战也已经收缩为个位数竞争。大模型“上海队”在基模研发上、造血盈利上都不拉垮,这属实可贵。

比如,商汤科技运用于代码、办公领域的生产力工具“小浣熊”,现已拥有超过1000万家行业用户。今年的大会上,商汤展区秀出其“朋友圈”,都是日日新大模型所赋能的智能硬件,包括了元萝卜ai下棋机器人,以及钛虎、傅利叶、lumos鹿明等多个品牌的人形机器人,以及小米眼镜等,涉及教育培训、家庭陪伴、景区导览等多个应用场景。徐立还特别演示了日日新大模型赋能下人形机器人讲解《长安的荔枝》案例。机器人讲解时,可自行翻页ppt,其解说风格诙谐幽默,可以被打断,可识别意图,还有全局记忆,即便被多次“扯远”,依旧能回到最初话题,应用落地潜力巨大。

阶跃星辰的商业化进程也不错,已与车、手机、具身智能领域的头部厂商合作,部分旗舰机型进入量产,包括吉利银河m9、曾被马斯克点赞的家庭情感机器人tcl ai me等。阶跃日前也公开透露,今年全年收入预计近10亿元。

模芯联动

“大模型发展至今,已经不是一个单纯的技术问题,也不再是单家公司做某一款产品的问题,而是需要共同创造一个社区,以通往agi的未来。生态发挥着重要作用。”各模型公司道出心声。

在此次“模型之问”论坛上,商汤科技联合华为、库帕思、海光、寒武纪、曦望sunrise、壁仞科技、麒麟软件、摩尔线程等十余家国产生态伙伴,共同发布“商汤大装置算力mall”。此举在当前大模型时代对算力需求持续激增、算力供应链安全挑战日益严峻的背景下尤显意义。

种种迹象表明,国产模型与国产算力之间,正在加速双向奔赴。7月25日,阶跃星辰发布step 3时,也同时宣布联合近十家芯片及基础设施厂商,发起“模芯生态创新联盟”。其中,燧原科技受邀成为首批成员,且运行step 3也已初步实现。据测算,step 3在国产芯片上“跑”,模型成本是友商的三分之一。

根据燧原科技创始人赵立东的判断,未来模型对推理算力的需求,将是训练算力的百倍甚至千倍。与此同时,算力基础设施正在走向系统化,相关的软硬件技术,包括超节点、网络技术、全光互联、低精度、分布式并行计算、虚拟化等,已不再是芯片公司单独可以完成,而是需要跨行业的协作,多方聚力,构建系统化解决方案。

赵立东说,燧原科技拥抱与众多伙伴的合作,已在算力基建、算力调度、算力服务、算力应用等多个方面深入携手,共同在国产智算关键领域寻求破局。

但大模型发展是一场长跑,其决赛季远未到来。面对平均每三个月就能带来“行业一震”,大模型“上海队”都表示,其目标只有一个——保持敬畏,继续留在牌桌上。

欢迎转发,但请注明出处“上海经信委”

上观号作者:上海经信委

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
上海女出纳贪污92万出逃6年后身亡,曾怀着孩子嫁给泰国残疾人

上海女出纳贪污92万出逃6年后身亡,曾怀着孩子嫁给泰国残疾人

史记趣闻
2026-01-01 20:40:03
雷军发文宣布!网友:太给力了

雷军发文宣布!网友:太给力了

先锋新闻
2026-01-01 16:21:29
特朗普说委内瑞拉抢了美国的石油

特朗普说委内瑞拉抢了美国的石油

财联社
2025-12-18 14:01:36
阚清子近照曝光!37岁产后状态引热议:为娃胖30斤长妊娠纹

阚清子近照曝光!37岁产后状态引热议:为娃胖30斤长妊娠纹

启迪你的思维
2026-01-03 10:56:19
65岁郎平洛杉矶跨年,穿红衣戴翡翠很贵气,吃大餐喝名酒生活滋润

65岁郎平洛杉矶跨年,穿红衣戴翡翠很贵气,吃大餐喝名酒生活滋润

疯说时尚
2026-01-03 10:53:26
学历已死?10个月卖几十亿美金:Manus团队用代码重写了人才规则书

学历已死?10个月卖几十亿美金:Manus团队用代码重写了人才规则书

留学生日报
2026-01-01 20:41:30
沙利文承认:佩洛西2022窜台,使美国付出了惨痛代价!

沙利文承认:佩洛西2022窜台,使美国付出了惨痛代价!

华山穹剑
2026-01-02 20:28:02
沈梦辰和杨迪在跨年发生肢体冲突?本人下场回应,婉称交情依旧

沈梦辰和杨迪在跨年发生肢体冲突?本人下场回应,婉称交情依旧

缘史记
2026-01-03 09:51:39
1983年乔冠华去世,新华社只发了一句话,胡乔木拍案而起:这也太不像话了

1983年乔冠华去世,新华社只发了一句话,胡乔木拍案而起:这也太不像话了

源溯历史
2025-12-31 20:03:15
今晨跌破冰点!假期后天气怎么变? | 天气早知道

今晨跌破冰点!假期后天气怎么变? | 天气早知道

上观新闻
2026-01-03 12:10:05
57岁歌唱家张也:虽然我没有伴侣没有孩子,但是我有老年生活搭子

57岁歌唱家张也:虽然我没有伴侣没有孩子,但是我有老年生活搭子

小熊侃史
2026-01-03 07:40:07
哭倒在女记者怀中?湖人男球迷身份曝光

哭倒在女记者怀中?湖人男球迷身份曝光

天光破云来
2026-01-02 12:29:26
伊朗强烈谴责美国,警告将果断回应任何侵略!伊总统曾发声:伊朗正处于一场全面战争之中

伊朗强烈谴责美国,警告将果断回应任何侵略!伊总统曾发声:伊朗正处于一场全面战争之中

每日经济新闻
2026-01-03 08:54:04
上海一商场买黄金排队800多号,工作人员:优惠活动已结束,下次要等到2026年底

上海一商场买黄金排队800多号,工作人员:优惠活动已结束,下次要等到2026年底

极目新闻
2026-01-02 21:36:29
CBA消息:刘炜正式下课,辽宁男篮敲定新外援,首钢押宝旧将争冠

CBA消息:刘炜正式下课,辽宁男篮敲定新外援,首钢押宝旧将争冠

理工男评篮球
2026-01-03 14:19:48
要闻:泽连斯基推荐布达诺夫出任乌2号人物,释放出强硬信号

要闻:泽连斯基推荐布达诺夫出任乌2号人物,释放出强硬信号

史政先锋
2026-01-02 23:59:05
女信徒把露肚史瑞克当佛像拜4年,网友安慰:心诚则灵。

女信徒把露肚史瑞克当佛像拜4年,网友安慰:心诚则灵。

环球趣闻分享
2026-01-03 14:00:06
台军专家一语惊人:台军已经把机密信息,都双手奉送给解放军了。

台军专家一语惊人:台军已经把机密信息,都双手奉送给解放军了。

时时有聊
2026-01-01 21:02:36
南博的风刮到国博!山东大叔捐万历鎏金佛像,20年寻踪竟查无此物

南博的风刮到国博!山东大叔捐万历鎏金佛像,20年寻踪竟查无此物

奇思妙想草叶君
2026-01-02 10:54:18
父母都是央视名人,被保送到英国名校,如今定居英国,生活很自在

父母都是央视名人,被保送到英国名校,如今定居英国,生活很自在

跳跳历史
2025-12-26 14:10:10
2026-01-03 15:59:00
上观新闻 incentive-icons
上观新闻
站上海,观天下
412349文章数 758527关注度
往期回顾 全部

科技要闻

比亚迪销冠!特斯拉2025年交付量跌逾8%

头条要闻

男子花29万买了一辆智界R7展车 撞车后拆出麻花和饼干

头条要闻

男子花29万买了一辆智界R7展车 撞车后拆出麻花和饼干

体育要闻

快船似乎又行了

娱乐要闻

“国服嫂子”司晓迪,曝与多位男星私照

财经要闻

人工智能四问:投资泡沫出现了吗?

汽车要闻

奕派科技全年销量275,752辆 同比增长28.3

态度原创

家居
教育
数码
房产
公开课

家居要闻

无形有行 自然与灵感诗意

教育要闻

99999次方看着可怕,分类讨论不难

数码要闻

苹果首款低价MacBook即将发布:搭载A18 Pro芯片+12.9英寸屏幕

房产要闻

海大誉府新年家年华暨2号楼耀世加推发布会圆满落幕

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版