网易首页 > 网易号 > 正文 申请入驻

在史上最大规模WAIC中寻找DeepSeek

0
分享至

今年的上海世界人工智能大会(WAIC)比去年有什么不同,最简单现成的答案,就是DeepSeek。

从会到WAIC,DeepSeek从未亲临现场,却依然是中国开源技术栈叙事的支点,定义了叙事节奏、商业尺度与国际话语权的边界。WAIC的几处关键画面印证了这一切。

无论DeepSeek未来如何,它正如OpenAI证明扩展涌现智能一样,打破了原先束缚中国创新的思维惯性。开源模型可以逼近最前沿的闭源模型,这样的硬核创新也完全可以只由中国本土人才实现;开源模型将冲击闭源模型创建的商业体系,中国可以凭借开源技术栈争夺全球市场,并在与美国竞争中提高自己的话语权。在这个意义上,DeepSeek正在潜移默化地化身为具体的方法论。

也许前Google CEO埃里克·施密特(Eric Schmidt)对这一切深有感触。今年,他同时出席了巴黎峰会与WAIC。在巴黎峰会上,他警告西方国家需要加强构建开源AI模型,并呼吁西方与中国加强合作。这一次,他继续点赞DeepSeek,同时提议要与中国及其他开源技术的倡导者们合作。“未来超级智能之间的协作最终是不可避免的”,美国与中国在这些问题上的合作也是不可避免的。

DeepSeek不仅震撼了硅谷,也以冲击估值逻辑的方式,激活了“六小虎”中尚存AGI信仰的企业。在今年的WAIC上,“六小虎”并没有悉数到场。已经放弃AGI的百川智能与零一万物缺席了;智谱AI和月之暗面(MoonShot)到场,但展位不大;阶跃星辰(StepFun)与稀宇科技(MiniMax)动静最大,这既是因为“东道主”的身份,也因为就差阶跃星辰拿出点什么来。

MiniMax创始人闫俊杰的演讲,被主办方恰好排在了之后。后者也是这届WAIC最大亮点之一。闫俊杰为更多AI初创企业鼓劲称,大模型参数规模的增长速度,在过去半年已经放缓,拥有非常多算力的公司和没有那么多算力的公司,在训练上的差异可能不会那么大。增量部署的算力,很多花在做更多的研究跟探索上。但是,研究和探索,除了取决于算力之外,还取决于高效的整体实验设计,高效的研发团队,以及一些天才的创意。这呼应了辛顿所说的,如果想做真正原创性研究,就应该去寻找那些你认为“所有人都搞错了”的领域。

阶跃星辰则拿出了旗舰基础模型Step 3。这就是该公司研究与探索的最新成果。这个3210亿总参数规模,每次激活380亿参数的模型,在多项基准测试中表现突出,阶跃星辰称之为“最强开源多模态推理模型”。作为推理模型,它具备视觉能力。多模态也正是阶跃星辰最擅长的,CEO姜大昕称,多模态领域也开始向强化学习过渡。在这次WAIC上,阶跃星辰还发布了多模理解生成一体化模型Step 3o Vision以及第二代端到端语音大模型Step-Audio 2。


Step 3会在7月31日开源,将迎来更严格的一线开发者的试用与评价,也会有更多技术细节披露。刷榜粉饰无法被利益中立的第三方成功复现。如果说实现AGI,验证是否容易决定着能力的边界,那么,某种意义上开源模型一直都在接受着最广泛与最深入的验证。这正是开源真正推动了创新的关键之一。这也是去年底至今DeepSeek被推向聚光灯下最关键的原因之一。

至此,“六小虎”中仍在研发预训练大模型的全部交卷,而且都将DeepSeek视为了不得不超越的对象。与OpenAI在发布ChatGPT与GPT-4,证明Transformer可以带来智能涌现后一样,证明了中国可以主导开源创新,而且开源创新可以无限逼近全球最领先水平的DeepSeek,成为了其他企业追赶与超越的对象。

今年二季度,智谱更新了GLM-4-0414,称其性能可与OpenAI的GPT系列和DeepSeek的V3/R1系列相媲美;MiniMax与月之暗面更不用说,前者,就是DeepSeek曾用过的方式,后者的K2更是实现了对R1-0528的超越,登顶LMArena的开源模型榜单。这次,阶跃星辰也称在国产芯片上的推理效率,最高可达DeepSeek-R1的300%。

不在场的DeepSeek仍然无处不在。蚂蚁数科在金融垂直领域的大模型Agentar-Fin-R1-32B,宣称在各项金融测评集上,超越了超大尺寸推理模型R1和GPT-o1。而壁仞科技创始人张文则提到,Deepseek等国产大模型牵动了国内芯片的设计发展。

OpenAI仍然没有发布GPT-5。这使得世界停留在GPT-4时代,持续小步创新。从GPT-4到GPT-5的这段时间,成为其他企业纷纷超越的窗口期。传言这一切最快会在本月底或8月初改变。DeepSeek也没有发布V4或者R2,也给了国内企业追赶反超的机会。在缺乏颠覆性创新的情况下,反超存在不同解读语境。

DeepSeek曾以更低的训练成本与更高性价比的推理震惊硅谷。但是,token经济学的现实意义,在于它必须服务于应用场景的具体实践。在这个时候,单纯比较每百万token的价格意义并不唯一,它必须与首个token生成延迟、每秒每用户token数,以及上下文窗口等关键性能指标联动。

这也是初创企业通过技术创新与模型迭代,可以超越DeepSeek的现实维度。MiniMax的M1引入了闪电注意力机制(Lightning Attention),以更低的算力消耗,带来了更长的推理空间;它支持100万tokens 输入,是DeepSeek-R1的八倍。月之暗面的K2采用了,更多的专家,改良了MuonClip与QK-Clip,可以提高长上下文效率与每个token的处理效率。阶跃星辰的Step 3则强调了对国产芯片更彻底的软硬件优化,还联合了10家国产芯片、基础设施厂商,发起成立了“模芯创新生态联盟”;在英伟达的CUDA生态上,Step 3相较R1的吞吐量也提升了超70%。

在DeepSeek开启的中国开源技术栈的叙事上,这些聚焦于低成本与高效率的创新与反超,更具现实与时代意义。最近很长一段时间,AI行业的重心已经从基础模型突破转向了应用落地。开源模型正是推动应用创新的关键力量。

这场有史以来规模最大的世界人工智能大会(WAIC)也不例外。谈论基础模型创新的越来越少,谈论智能体与端侧应用的越来越多,它们都是具体的“执行者”,分别对应数字世界与物理世界。机器人企业占据了整整一层楼,从去年的18家攀升至今年的80家,与AI还隔着一层机器人的供应链企业也来了;阿里巴巴把大模型装进了夸克AI眼镜,腾讯在发布混元世界模型1.0之外,还推出了智能体全家桶。

不过,在基础模型领域,阶跃星辰与稀宇科技是这次在WAIC亮相的少数真正打出“硬牌”的初创公司。相比DeepSeek目前仍以追求AGI为唯一目标,对终端用户体验和商业化路径兴趣不大,这两家公司仍然在意。它们相对DeepSeek的进步,也正是围绕如何多快好省地推动应用落地展开的。年化收入10亿元人民币正在成为新的门槛。在本届WAIC中,达到这一收入规模的初创公司,除了阶跃星辰,还有宇树科技与智元机器人,后两者最近也开源了不少数据集。

从年初至今,美国对中国开源技术栈的解读,都更具地缘竞争意味。硅谷与华盛顿担心美国以外的世界,。在这一届WAIC上,中国更前进了一步,把这一叙事做实了。会上发布的《人工智能全球治理行动计划》,提议打造跨国开源社区和安全、可靠开源平台,释放出了强烈的信号。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
基恩:汉尼拔不是不走运而是愚蠢,利物浦展现了顶级球队风范

基恩:汉尼拔不是不走运而是愚蠢,利物浦展现了顶级球队风范

雷速体育
2025-09-15 00:06:22
埃梅加因转会切尔西遭极端球迷抨击,白学堡主帅:这缺乏尊重

埃梅加因转会切尔西遭极端球迷抨击,白学堡主帅:这缺乏尊重

懂球帝
2025-09-15 06:31:06
25亿镑被冻结超3年!英媒:英国政府与阿布近20个月仅会面4次

25亿镑被冻结超3年!英媒:英国政府与阿布近20个月仅会面4次

直播吧
2025-09-13 22:33:13
李雪主:金家看中,男友被除,击败多名竞争者,靠一招征服金正恩

李雪主:金家看中,男友被除,击败多名竞争者,靠一招征服金正恩

阿胡
2024-02-22 11:37:05
越是屁股大腿粗的女人越耐看?

越是屁股大腿粗的女人越耐看?

健身S叔
2025-08-07 06:49:46
台媒:台当局表示不排除发展新核能

台媒:台当局表示不排除发展新核能

参考消息
2025-09-14 19:52:06
2025年8月优秀演员榜 田野憂拿下销量双料王

2025年8月优秀演员榜 田野憂拿下销量双料王

素然追光
2025-09-13 05:30:04
不许改变黄岩岛现状,菲方紧急召见中方使节,不料被反将一军

不许改变黄岩岛现状,菲方紧急召见中方使节,不料被反将一军

湘评中外
2025-09-14 17:21:48
全球见证历史的时刻到了:波兰惨遭入侵,特朗普紧急发文,绷不住

全球见证历史的时刻到了:波兰惨遭入侵,特朗普紧急发文,绷不住

仙味少女心
2025-09-12 23:44:26
隔壁夫妻天天蹭我充电桩,我怒断电源出国游,3天后物业打来电话

隔壁夫妻天天蹭我充电桩,我怒断电源出国游,3天后物业打来电话

清茶浅谈
2025-09-11 21:10:19
韩庚演唱会被嘲吃相难看!脸僵像王阳身材像黄渤,舞都跳不动了

韩庚演唱会被嘲吃相难看!脸僵像王阳身材像黄渤,舞都跳不动了

郑丁嘉话
2025-09-14 11:40:56
当了17年中国女婿,圈中国的钱回到日本竟公然辱华,如今他还好吗

当了17年中国女婿,圈中国的钱回到日本竟公然辱华,如今他还好吗

黄谋仕
2025-09-14 21:59:13
顶级财团荣氏家族:脱离中信集团又如何,谁说他们不“富可敌国”

顶级财团荣氏家族:脱离中信集团又如何,谁说他们不“富可敌国”

牛牛叨史
2025-09-14 03:40:35
张朝阳成功横渡广东潮汕南澳岛饶平海湾,用时5小时18分,曾称“不害怕水,生命在于折腾”

张朝阳成功横渡广东潮汕南澳岛饶平海湾,用时5小时18分,曾称“不害怕水,生命在于折腾”

鲁中晨报
2025-09-14 20:39:22
涉嫌严重违纪违法,原董事长刘伟被查

涉嫌严重违纪违法,原董事长刘伟被查

FM93浙江交通之声
2025-09-14 11:10:54
9.15早评|周末吹爆了!本周A股两件王炸大事!

9.15早评|周末吹爆了!本周A股两件王炸大事!

龙行天下虎
2025-09-15 01:58:26
网球名宿对阿尔卡拉兹美网夺冠后的前景表示担忧:别成为行尸走肉

网球名宿对阿尔卡拉兹美网夺冠后的前景表示担忧:别成为行尸走肉

搏击江湖
2025-09-14 20:30:23
北约国家实现全员军费达到GDP的2%,却发现比利时等几国留了心眼

北约国家实现全员军费达到GDP的2%,却发现比利时等几国留了心眼

陶慕剑地球观察
2025-09-11 15:57:14
39岁江疏影巴塞罗那街头被偶遇 没有化妆 素颜状态超绝 本人很松弛

39岁江疏影巴塞罗那街头被偶遇 没有化妆 素颜状态超绝 本人很松弛

TVB的四小花
2025-09-12 13:21:37
42岁男子脂肪肝去世,再次提醒:脂肪肝是一堆病,想逆转记住7点

42岁男子脂肪肝去世,再次提醒:脂肪肝是一堆病,想逆转记住7点

华医网
2025-09-15 05:41:18
2025-09-15 07:04:49
未尽研究 incentive-icons
未尽研究
新能源、人工智能、合成生物、地缘X
196文章数 41关注度
往期回顾 全部

科技要闻

L3级车型要来了!辅助驾驶迎重大利好

头条要闻

罗永浩深夜发文:贾总 找个平台直播理性对一次话吧

头条要闻

罗永浩深夜发文:贾总 找个平台直播理性对一次话吧

体育要闻

利物浦1-0绝杀十人伯恩利 萨拉赫95分钟点射

娱乐要闻

花泽香菜官宣离婚 结束与老公5年婚姻

财经要闻

西贝贾国龙,“错”得离谱

汽车要闻

混动狂潮 835马力V12 阿斯顿·马丁的最后浪漫

态度原创

游戏
健康
教育
家居
军事航空

《隐形守护者》导演新影游demo15日上线!有金发美女

内分泌科专家破解身高八大谣言

教育要闻

山东多校开展开学第一课活动,费曼学习法被推荐

家居要闻

原木风格 温馨舒适氛围

军事要闻

俄无人机飞入波兰 美国务卿:不可接受

无障碍浏览 进入关怀版