网易首页 > 网易科技 > 网易科技 > 正文

对话姜大昕:AGI实现路径清晰了,世界模型不远了

0
分享至


出品|网易科技《AGI对话》栏目

作者|丁广胜

大模型进化路线持续分野,阶跃星辰追求AGI的决心反而更加坚定。

成立于2023年4月的阶跃星辰刚刚过完两岁生日,模型发布频率和产业落地探索正在前所未有地加速。

阶跃星辰累计发布了22款自研基座模型,覆盖文字、语音、图像、视频、音乐、推理等全系列。其中,16款是多模态模型,占比七成。目前仍然保持“月更”状态。

阶跃星辰创始人、CEO姜大昕说,追求智能的上限仍然是当下最重要的一件事。

姜大昕的目标是坚决探索通往AGI,且多模态是实现AGI的必由路径。他把模型演进路线图划分为三个阶段,即模拟世界—探索世界—归纳世界。

首先,模拟世界的训练范式是模仿学习,核心是学习海量互联网数据;其次,探索世界是追求“系统二”的能力,实现慢思考;其三,智能的尽头是归纳世界,机器能够自主学习、主动发现人类尚未发现的物理规律。

姜大昕还特别强调从多模态融合走向多模态理解生成一体化,因为“在多模态领域任何一个方向出现短板,都会延缓实现 AGI 的进程。”

在国内大模型公司里,像这样重视模态全覆盖,并且坚持原生多模理念的公司并不多。这被视为阶跃星辰的独特优势。

“我们需要 AI 能听、能看、能说,这样它才能更好地理解用户所处的环境,并且和用户进行更为自然的交流。目前的大模型公司有能力去全面自研预训练模型,并构成模型矩阵的,即使是大公司也不多,更不用说是初创公司了,这是阶跃星辰的一个特色,也是我们的优势。”

多模态模型的两大趋势

强调多模型理解生成的阶跃星辰,是这么想也是这么做的,不断探索模型能力的同时加速落地验证。

第一是预训练加上强化学习,激发模型推理的时候产生长思维链,极大地提高模型的推理能力。

姜大昕说,推理模型已经从趋势变成了范式。

阶跃星辰在今年1月份发布了一款推理模型 Step R-Mini,“它的速度很快,推理能力挺强,超出了当时的 o1的 preview 的版本,我们预计在未来的三个月内发布满血版的 Step-R1。”

第二个趋势是多模态理解生成一体化,也就是如何把推理引入到多模态领域。

姜大昕举一个例子,有一张足球比赛现场的图片,一般视觉理解是训练时看到过类似的图,然后给出结果。而加了推理的视觉模型可以根据图片中的广告牌、球衣颜色等更多特征信息给出更准确的答案。

这样的探索已经延伸到短剧领域。“现在短剧最卡脖子、最瓶颈的地方不是短剧生产,而是短剧审核。因为全部需要人工审核,效率非常低,用了阶跃星辰的模型后审核效率从原来的90天可以变成一个星期。”

姜大昕还进一步解释了“多模理解生成一体化”路线的正确性:

为什么要做理解和生成?因为生成的内容需要理解来控制,为了保证生成的内容有意义,即生成需要理解来控制。反过来,理解需要生成来监督。但他也表示,从整个行业看,这个路线还有卡点和挑战。

“到现在为止计算机视觉做了几十年,不幸的是这个问题(视觉理解生成一体化)仍然没有被解决。”姜大昕表示,理解生成一体化是整个计算机视觉需要突破的一个堡垒。

AGI的实现路径清晰了

何时能实现世界模型,姜大昕眼中的 AGI 就实现了,他近期感受最深的一点是,路线越来越清晰了。

他回顾技术发展路线说,2017年transformer 架构对业界最大的意义在于它是一个 scalable(可扩展) 的文本的理解生成一体化的架构。

在那之前, LSTM(长短期记忆网络)或者RNN循环神经网络或者其他模型都不能 scalable。正因为有了这个 scalable 的架构以后,到了2020年 GPT-3来了,GPT-3的意义在于我们第一次把海量的互联网数据放到了这个 scalable 的架构上,可以让它用一个模型去处理所有 NLP 的任务。但那个时候它需要一些例子,然后它用一个模型来告诉你要怎么做。

再往前一步,到了2022年 ChatGPT来了,就是在预训练模型的基础上再加上指令跟随,这是 GPT-3.5做的事情,到了 GPT-4的时候这个能力进一步增强,所以我们经常谈到 "GPT-4时刻",指的就是在这个模态上,模型真正能达到跟人的智能差不多的水平。

到目前为止,语言模型的技术路线基本上收敛了,没有出现别的分支,不管是 OpenAI 也好、Google 也好、Anthropic 也好,或者国内任何的公司,语言模型都在朝着这条路往下走。

姜大昕相信,视觉也是可以 follow 同样的路线。

“如果我能够用海量的视频去做预训练,它能 predict next frame (预测下一帧)以后,然后类似语言模型一样加各种指令,让它去预测,再往后做推理,如果能做到时空推理、加上3D 、再加上自然语言学习,那就是世界模型了。”

而世界模型,就是姜大昕眼中AGI的模样。而挑战正在于此,这件事的原点就是彻底地解决理解生成一体化。

姜大昕断言,这个问题一旦突破以后,今后的道路会非常顺畅,视频就会和文本一起发展到世界模型。直到抵达AGI。

智能体将从数字走向物理

2025年是Agent 元年,姜大昕总结了两个之所以爆发的条件,一个是多模态的能力,一个是慢思考的能力,这两个能力恰好在2024年的时候取得了突破性进展。

阶跃星辰的发力方向是智能终端 Agent,并在此投入重兵。

姜大昕认为,终端是用户感知和体验的延伸,而且它能帮你完成任务。这是阶跃星辰选择这个赛道的原因。

目前倾注精力的有四个方向,一个是与OPPO等厂商合作的AI手机赛道。一个是和吉利汽车、千里科技合作的智能汽车赛道。一个是和TCL等厂商合作的IoT设备领域。一个是具身智能领域。

阶跃星辰正在具身智能领域投注精力,与智元机器人和原力灵机机器人合作,其中阶跃的多模态大模型是机器人的大脑,以感知、理解这个世界。未来目标是实现视觉的泛化、机器人的泛化。

在家庭场景,姜大昕还描绘了这样一幅场景,在未来,大家不需要了解微波炉的功能,不需要去研究每个功能怎么使用,把鸡蛋放进去,给出指令即可。也不需要知道如何设定,这就是智能终端。家庭场景的想象力大有可为。

姜大昕用三点来概括阶跃星辰的发展蓝图。

第一,坚持基础大模型研发,追求 AGI 不会改变。第二,阶跃差异化的特点就是多模态的能力。第三,在智能终端 Agent 方向上发力,最终形成从模型到 Agent,从云侧到端侧的生态体系。

在Agent 元年,姜大昕希望有所坚持,有所选择。摆在他们眼前的任务,是让智能体从数字世界走向物理世界。

延伸阅读
相关推荐
热点推荐
环球小姐被要求穿一套自己国家特色的衣服!然后韩国亮了

环球小姐被要求穿一套自己国家特色的衣服!然后韩国亮了

谭老师地理大课堂
2025-12-18 17:24:52
南华大学附二院辟谣,从未与柬埔寨生命科学院合作

南华大学附二院辟谣,从未与柬埔寨生命科学院合作

比尔盖凯
2025-12-19 15:03:10
南博后续又有新进展!《江南春》被一位名叫“顾客”的顾客买走

南博后续又有新进展!《江南春》被一位名叫“顾客”的顾客买走

垛垛糖
2025-12-19 19:40:46
翁帆新消息传来,太令人惊喜了

翁帆新消息传来,太令人惊喜了

深度报
2025-12-18 22:35:44
一顿饭近千元, 一扎西瓜汁卖168, 全聚德是怎么把顾客吃跑的?

一顿饭近千元, 一扎西瓜汁卖168, 全聚德是怎么把顾客吃跑的?

阿器谈史
2025-12-17 19:45:09
演员温峥嵘:已刑事立案

演员温峥嵘:已刑事立案

民间平哥
2025-12-19 15:40:45
5国仅来1人,日本脸丢完了,4国“已读不回”,围堵中国成笑话

5国仅来1人,日本脸丢完了,4国“已读不回”,围堵中国成笑话

南宫一二
2025-12-19 17:36:33
俄领导人威胁称,如果谈判失败,俄罗斯将“以武力”夺取领土

俄领导人威胁称,如果谈判失败,俄罗斯将“以武力”夺取领土

山河路口
2025-12-17 22:34:47
MVP榜单更新,前三不变布伦森冲进前五,火箭输球申京不降反升

MVP榜单更新,前三不变布伦森冲进前五,火箭输球申京不降反升

拾叁懂球
2025-12-20 04:19:57
单飞失败!36岁小安帅下课:再次投奔父亲 备战2026世界杯

单飞失败!36岁小安帅下课:再次投奔父亲 备战2026世界杯

叶青足球世界
2025-12-19 16:54:48
放弃争夺数百亿遗产,带着女儿远遁美国,如今才知道她有多清醒

放弃争夺数百亿遗产,带着女儿远遁美国,如今才知道她有多清醒

梦史
2025-12-16 11:07:49
《江南春》被卖6800元,马未都说购买者叫顾客没问题,否则有嫌疑

《江南春》被卖6800元,马未都说购买者叫顾客没问题,否则有嫌疑

汉史趣闻
2025-12-19 17:43:36
塔吊距楼18米、安全出口减半……中央安全生产考核巡查组明察暗访细节披露

塔吊距楼18米、安全出口减半……中央安全生产考核巡查组明察暗访细节披露

环球网资讯
2025-12-15 14:55:13
恶心!北京女子带狗吃涮肉舔遍盘子,餐厅追责:北京一套房不够赔

恶心!北京女子带狗吃涮肉舔遍盘子,餐厅追责:北京一套房不够赔

派大星纪录片
2025-12-19 14:17:34
杭州碎尸案已经过去五年!整栋楼如今还是无人居住,房价跌入谷底

杭州碎尸案已经过去五年!整栋楼如今还是无人居住,房价跌入谷底

逍遥浪腾云
2025-12-18 17:14:26
向高市早苗示好不到24小时,张本底细被扒,父母的黑历史也被翻出

向高市早苗示好不到24小时,张本底细被扒,父母的黑历史也被翻出

牛锅巴小钒
2025-12-19 13:34:11
54岁陈松伶减重27斤,皮松脸黑括号纹很深,和老公站一起像两代人

54岁陈松伶减重27斤,皮松脸黑括号纹很深,和老公站一起像两代人

娱圈小愚
2025-12-19 10:03:35
老公驻派中东3年,我深夜给5岁女儿掖被角,她说:爸爸每天半夜来

老公驻派中东3年,我深夜给5岁女儿掖被角,她说:爸爸每天半夜来

朝暮书屋
2025-12-17 18:26:03
魏建军再开炮!推出购车防忽悠指南,有些车企瑟瑟发抖

魏建军再开炮!推出购车防忽悠指南,有些车企瑟瑟发抖

象视汽车
2025-12-19 07:00:05
韩国海警举旗冲锋苏岩礁!强拆中方设施反被围,中方贴脸开大了

韩国海警举旗冲锋苏岩礁!强拆中方设施反被围,中方贴脸开大了

观察者小海风
2025-12-18 19:48:04
2025-12-20 07:43:00

科技要闻

许四清:具身智能的"ChatGPT时刻"还未到来

头条要闻

普京罕见回应私人生活 大方承认正在恋爱中

头条要闻

普京罕见回应私人生活 大方承认正在恋爱中

体育要闻

“恶龙”埃托奥,正在毁灭喀麦隆足球

娱乐要闻

曲协表态仅6天,郭德纲担心的事还是发生

财经要闻

日元加息,恐慌来了?货币三国杀

汽车要闻

“一体压铸”再引热议 一旦受损真的修不起吗?

态度原创

教育
亲子
游戏
公开课
军事航空

教育要闻

教育部这次动真格的了!教育界泰斗:不能让80%学生为20%精英陪跑

亲子要闻

宝妈必学,为什么教孩子不舒服的触摸要拒绝是错误的?

网易!你把棋盘掀了那我玩什么!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

媒体:美方官宣史上对台单笔最大军售 野心藏不住了

无障碍浏览 进入关怀版
×