网易首页 > 网易号 > 正文 申请入驻

清华唐杰:领域大模型,伪命题

0
分享至

编辑部 整理
量子位 | 公众号 QbitAI

清华教授唐杰最新在微博发表了自己关于AI的一些感悟,非常值得一读~

共八个小点,不算长篇大论,但扎实有料:

  • 基座模型继续scaling仍然高效;
  • 真实使用体验想进一步上台阶,长尾能力的对齐和推理增强绕不过去;
  • Agent代表模型开始进入环境、开始形成生产力;
  • 一旦模型进入持续交互的世界,记忆机制、在线学习、自我评估就会成为核心工程题,而不是可选项;
  • AI终究要落到替人完成工作、创造增量价值上;
  • 领域大模型是个伪命题;

唐杰表示,发微博是想分享一下,希望对大家有用。

兹以推文刊载,供大家广泛阅读、传播。



以下为其感悟原文:

01,关于scaling基座模型

预训练使得大模型已经掌握世界常识知识,并且具备简单推理能力。

更多数据、更大参数和更饱和的计算仍然是scaling基座模型最高效的办法。

02,关于激活对齐和增强推理能力

激活对齐和增强推理能力,尤其是激活更全面的长尾能力是保证模型效果的另一关键,通用benchmark的出现一方面评测了模型通用效果,但也可能使得很多模型过拟合。

真实场景下是如何让模型更快、更好的对齐长尾的真实场景,增强实际体感。

mid和post training使得更多场景的快速对齐和强推理能力成为可能。

03,关于Agent

agent是模型能力扩展的一个里程碑,也是体现ai模型进入人类真实(虚拟/物理)世界的关键。

没有agent能力,大模型将停留在(理论学习)阶段,就类似一个人不断学习,哪怕学习到博士,也只是知识积累,还没有转化为生产力。

原来的agent是通过模型应用来实现,现在模型已经可以直接将agent数据集成到训练过程,增强了模型的通用性,其实难题还是不同agent环境的泛化和迁移并不是那么容易,因此最简单办法也只有不断增加不同agent环境的数据和针对不同环境的强化学习。

04,关于模型记忆

实现模型记忆成为一个必须做的事情,这也是一个模型应用到真实环境必须有的能力。

人类记忆分为短期(前额叶)、中期(海马体)、长期(分布式大脑皮层)、人类历史(wiki或史书)四个阶段。

大模型如何实现不同阶段的记忆是个关键,context、rag、模型参数可能分别对应了人类的不同记忆阶段,但如何实现是个关键,一种办法是压缩记忆,简单存在context,如果大模型可以支持足够长的context,那基本有可能实现短中长期的记忆。

如何迭代模型知识,更改模型参数这还是个难题。

05,关于在线学习与自我评估

在线学习与自我评估。

有了记忆机理,在线学习成为一个重点,目前的大模型定时重新训练,这有几个问题:

  • 模型无法真正的自我迭代,但模型的自学习自迭代一定会是下一个阶段必然具有的能力;
  • 重新训练还比较浪费,同时也会丢掉很多交互数据。

因此如何实现在线学习是个关键,自我评估是在线学习的一个关键点,要想模型自我学习,模型首先要知道自己对还是不对,如果知道了(哪怕概率知道)模型就知道了优化目标,能够自我改进。

因此构建模型自我评价机制是个难题。

这也可能是下一个scaling范式。

continual learning/real time learning/online learning?

06,关于模型研发和应用结合

最后,大模型的发展越来越端到端,不可避免的要把模型研发和模型应用结合起来。

ai模型应用的第一性不应该是创造新的app,他的本质是agi替代人类工作,因此研发替代不同工种的ai是应用的关键。

chat部分替代了搜索,部分其实融合了情感交互。

明年将是ai替代不同工种的爆发年。

07,关于多模态和具身

写在最后的是多模态和具身。

多模态肯定是个未来也很有前景,当下的问题是多模态不大能帮助到agi的智能上界,而通用agi的智能上界到底在哪儿还不知道。

可能最有效的方式还是分开发展,文本、多模态、多模态生成。

当然适度的探索这三者的结合肯定能发现一些很不一样的能力,这需要勇气和雄厚的资本支持。

同理,如果看懂了agent就知道具身的痛在哪里了,太难通用了(也不一定),但至少少样本去激活通用具身能力基本不可能。

那怎么办呢,采数据,或者合成数据,都不是那么容易,也贵。

但反之一旦数据规模上去了,通用能力出来了自然会形成门槛。

当然这只是智能方面的难题,对于具身,机器人本身也是个问题,不稳定,故障频繁都限制了具身智能的发展。

2026年这些都将取得长足进步。

08,关于领域大模型和大模型应用

也讨论一下领域大模型和大模型应用。

我一直认为领域大模型就是个伪命题,都agi了哪有什么domain-specific agi……

但,agi还没实现,领域模型会长时间存在(多长,不好说,ai发展实在太快了)。

领域模型的存在本质上是应用企业不愿意在ai企业面前认输,希望构建领域know how的护城河,不希望ai入侵,希望把ai驯化为工具。

而ai的本质是海啸,走到哪里都将一切卷了进去,一定有一些领域公司走出护城河,自然就卷进了agi的世界。

简而言之,领域的数据、流程、agent数据慢慢的都会进入主模型。

而大模型的应用也要回到第一性原理,ai不需要创建新的应用。

ai的本质是模拟人或者代替人或者帮助人实现人类的某些必须要做到事(某些工种)。

可能就是两种,一种就是ai化以前的软件,原来需要人参与的改成ai,另一种就是创造对齐人类某个工种的ai软件,替代人类工作。

所以大模型应用需要帮助到人、创造新的价值。

如果做一个ai软件没人用,不能产生价值,那这个ai软件肯定没有生命力。

参考链接:
https://weibo.com/2126427211/5247011059141988

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
湖南95后女生上门做年夜饭月入4万多:春节前订单就满了,希望来年在长沙买房

湖南95后女生上门做年夜饭月入4万多:春节前订单就满了,希望来年在长沙买房

潇湘晨报
2026-02-17 13:27:13
深夜,直线跳水!美伊,重大突发

深夜,直线跳水!美伊,重大突发

证券时报
2026-02-17 23:02:06
“性虐待多名女性,暴力咬伤7岁女童阴部”虽辞职却仍有巨额财富

“性虐待多名女性,暴力咬伤7岁女童阴部”虽辞职却仍有巨额财富

丫头舫
2026-02-17 12:57:24
“罗翔夹着尾巴逃跑了”,攻击智者罗翔并显得你们多聪明

“罗翔夹着尾巴逃跑了”,攻击智者罗翔并显得你们多聪明

廖保平
2026-02-16 09:43:16
春晚飘过40载,今年春晚尤其难看

春晚飘过40载,今年春晚尤其难看

凤眼论
2026-02-16 22:50:18
欧洲小偷,都传疯了,达成了一个行业共识,中国人的钱包,随便拿

欧洲小偷,都传疯了,达成了一个行业共识,中国人的钱包,随便拿

西楼知趣杂谈
2026-02-14 18:35:51
在日华人直言:如今中国要是再和日本发生冲突,根本撑不过14年!

在日华人直言:如今中国要是再和日本发生冲突,根本撑不过14年!

南权先生
2026-02-12 15:39:07
英法德等五国联合声明,俄方发声

英法德等五国联合声明,俄方发声

扬子晚报
2026-02-17 18:43:46
创历史!韩旭25分钟狂轰25+14+4帽 率队2-0进WNBL总决赛

创历史!韩旭25分钟狂轰25+14+4帽 率队2-0进WNBL总决赛

醉卧浮生
2026-02-17 17:51:23
气急败坏!韩媒:林孝埈500米绊住了韩国的脚 黄大宪林钟彦无缘夺金

气急败坏!韩媒:林孝埈500米绊住了韩国的脚 黄大宪林钟彦无缘夺金

818体育
2026-02-17 21:05:40
赛场频现违例,中国冰壶队:相信世界壶联有办法解决争议

赛场频现违例,中国冰壶队:相信世界壶联有办法解决争议

澎湃新闻
2026-02-17 10:17:03
台湾震传媒民调:63.5%的受访民众不接受郑丽文的身份认同主张

台湾震传媒民调:63.5%的受访民众不接受郑丽文的身份认同主张

总在茶余后
2026-02-16 23:18:17
最大“骗局”是山姆超市,靠一张 260 元的会员卡一年狂揽 660 亿

最大“骗局”是山姆超市,靠一张 260 元的会员卡一年狂揽 660 亿

南权先生
2026-01-19 15:38:30
英国男子大闹香港机场打砸机器被捕,背包里检获疑“伟哥”管制药品:案发前原本计划买机票离开香港

英国男子大闹香港机场打砸机器被捕,背包里检获疑“伟哥”管制药品:案发前原本计划买机票离开香港

大风新闻
2026-02-17 17:52:16
黄循财:日本给我们的苦难教训极重

黄循财:日本给我们的苦难教训极重

上观新闻
2026-02-17 13:57:06
山东一家3口人的年夜饭,发朋友圈火了,网友:太寒酸,不忍看!

山东一家3口人的年夜饭,发朋友圈火了,网友:太寒酸,不忍看!

乐悠悠娱乐
2026-02-17 13:29:23
被李琰执教征服!男子速度滑冰团体创历史,在哪执教哪出成绩!

被李琰执教征服!男子速度滑冰团体创历史,在哪执教哪出成绩!

篮球资讯达人
2026-02-18 00:01:27
湖南一男子刚领到百万征收款,就被亲戚牌桌上5次设局诈骗175.12万元:招募多人组成“气氛组”,刺激其加大赌注

湖南一男子刚领到百万征收款,就被亲戚牌桌上5次设局诈骗175.12万元:招募多人组成“气氛组”,刺激其加大赌注

大风新闻
2026-02-17 19:37:03
直冲24℃!浙江升温时间定了

直冲24℃!浙江升温时间定了

浙江之声
2026-02-17 10:57:40
大瓜!金融大佬和美女高管一起失联

大瓜!金融大佬和美女高管一起失联

微微热评
2026-02-17 21:30:40
2026-02-18 05:00:49
量子位 incentive-icons
量子位
追踪人工智能动态
12174文章数 176387关注度
往期回顾 全部

科技要闻

春晚这些机器人是怎样做到的?

头条要闻

加州州长纽森炮轰特朗普:把美国未来卖给中国

头条要闻

加州州长纽森炮轰特朗普:把美国未来卖给中国

体育要闻

谷爱凌:'不小心"拿到了银牌 祝大家马年大吉

娱乐要闻

春节档电影首波口碑出炉!

财经要闻

大年初一,这三件事很不寻常

汽车要闻

问界M6更多信息:乾崑智驾ADS4.0+鸿蒙座舱5.0

态度原创

家居
时尚
游戏
艺术
旅游

家居要闻

中古雅韵 乐韵伴日常

今年春天最流行的4组配色,过年穿时髦又高级!

2月XGP第二波新增!巫师3、天国拯救2等8款爽玩

艺术要闻

成都468烂尾楼,复工迹象越来越明显!

旅游要闻

特写:流光溢彩映维港 花车巡游贺新春

无障碍浏览 进入关怀版