网易首页 > 网易号 > 正文 申请入驻

清华唐杰:领域大模型,伪命题

0
分享至

编辑部 整理
量子位 | 公众号 QbitAI

清华教授唐杰最新在微博发表了自己关于AI的一些感悟,非常值得一读~

共八个小点,不算长篇大论,但扎实有料:

  • 基座模型继续scaling仍然高效;
  • 真实使用体验想进一步上台阶,长尾能力的对齐和推理增强绕不过去;
  • Agent代表模型开始进入环境、开始形成生产力;
  • 一旦模型进入持续交互的世界,记忆机制、在线学习、自我评估就会成为核心工程题,而不是可选项;
  • AI终究要落到替人完成工作、创造增量价值上;
  • 领域大模型是个伪命题;

唐杰表示,发微博是想分享一下,希望对大家有用。

兹以推文刊载,供大家广泛阅读、传播。



以下为其感悟原文:

01,关于scaling基座模型

预训练使得大模型已经掌握世界常识知识,并且具备简单推理能力。

更多数据、更大参数和更饱和的计算仍然是scaling基座模型最高效的办法。

02,关于激活对齐和增强推理能力

激活对齐和增强推理能力,尤其是激活更全面的长尾能力是保证模型效果的另一关键,通用benchmark的出现一方面评测了模型通用效果,但也可能使得很多模型过拟合。

真实场景下是如何让模型更快、更好的对齐长尾的真实场景,增强实际体感。

mid和post training使得更多场景的快速对齐和强推理能力成为可能。

03,关于Agent

agent是模型能力扩展的一个里程碑,也是体现ai模型进入人类真实(虚拟/物理)世界的关键。

没有agent能力,大模型将停留在(理论学习)阶段,就类似一个人不断学习,哪怕学习到博士,也只是知识积累,还没有转化为生产力。

原来的agent是通过模型应用来实现,现在模型已经可以直接将agent数据集成到训练过程,增强了模型的通用性,其实难题还是不同agent环境的泛化和迁移并不是那么容易,因此最简单办法也只有不断增加不同agent环境的数据和针对不同环境的强化学习。

04,关于模型记忆

实现模型记忆成为一个必须做的事情,这也是一个模型应用到真实环境必须有的能力。

人类记忆分为短期(前额叶)、中期(海马体)、长期(分布式大脑皮层)、人类历史(wiki或史书)四个阶段。

大模型如何实现不同阶段的记忆是个关键,context、rag、模型参数可能分别对应了人类的不同记忆阶段,但如何实现是个关键,一种办法是压缩记忆,简单存在context,如果大模型可以支持足够长的context,那基本有可能实现短中长期的记忆。

如何迭代模型知识,更改模型参数这还是个难题。

05,关于在线学习与自我评估

在线学习与自我评估。

有了记忆机理,在线学习成为一个重点,目前的大模型定时重新训练,这有几个问题:

  • 模型无法真正的自我迭代,但模型的自学习自迭代一定会是下一个阶段必然具有的能力;
  • 重新训练还比较浪费,同时也会丢掉很多交互数据。

因此如何实现在线学习是个关键,自我评估是在线学习的一个关键点,要想模型自我学习,模型首先要知道自己对还是不对,如果知道了(哪怕概率知道)模型就知道了优化目标,能够自我改进。

因此构建模型自我评价机制是个难题。

这也可能是下一个scaling范式。

continual learning/real time learning/online learning?

06,关于模型研发和应用结合

最后,大模型的发展越来越端到端,不可避免的要把模型研发和模型应用结合起来。

ai模型应用的第一性不应该是创造新的app,他的本质是agi替代人类工作,因此研发替代不同工种的ai是应用的关键。

chat部分替代了搜索,部分其实融合了情感交互。

明年将是ai替代不同工种的爆发年。

07,关于多模态和具身

写在最后的是多模态和具身。

多模态肯定是个未来也很有前景,当下的问题是多模态不大能帮助到agi的智能上界,而通用agi的智能上界到底在哪儿还不知道。

可能最有效的方式还是分开发展,文本、多模态、多模态生成。

当然适度的探索这三者的结合肯定能发现一些很不一样的能力,这需要勇气和雄厚的资本支持。

同理,如果看懂了agent就知道具身的痛在哪里了,太难通用了(也不一定),但至少少样本去激活通用具身能力基本不可能。

那怎么办呢,采数据,或者合成数据,都不是那么容易,也贵。

但反之一旦数据规模上去了,通用能力出来了自然会形成门槛。

当然这只是智能方面的难题,对于具身,机器人本身也是个问题,不稳定,故障频繁都限制了具身智能的发展。

2026年这些都将取得长足进步。

08,关于领域大模型和大模型应用

也讨论一下领域大模型和大模型应用。

我一直认为领域大模型就是个伪命题,都agi了哪有什么domain-specific agi……

但,agi还没实现,领域模型会长时间存在(多长,不好说,ai发展实在太快了)。

领域模型的存在本质上是应用企业不愿意在ai企业面前认输,希望构建领域know how的护城河,不希望ai入侵,希望把ai驯化为工具。

而ai的本质是海啸,走到哪里都将一切卷了进去,一定有一些领域公司走出护城河,自然就卷进了agi的世界。

简而言之,领域的数据、流程、agent数据慢慢的都会进入主模型。

而大模型的应用也要回到第一性原理,ai不需要创建新的应用。

ai的本质是模拟人或者代替人或者帮助人实现人类的某些必须要做到事(某些工种)。

可能就是两种,一种就是ai化以前的软件,原来需要人参与的改成ai,另一种就是创造对齐人类某个工种的ai软件,替代人类工作。

所以大模型应用需要帮助到人、创造新的价值。

如果做一个ai软件没人用,不能产生价值,那这个ai软件肯定没有生命力。

参考链接:
https://weibo.com/2126427211/5247011059141988

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
江西少年叶文斌失联,仅19岁,聊天曝光,浑身是伤,母亲闯柬埔寨

江西少年叶文斌失联,仅19岁,聊天曝光,浑身是伤,母亲闯柬埔寨

鋭娱之乐
2026-01-01 01:12:33
对越反击战期间,先前有 15 个国家明确站队支持越南,然而战争正式打响后,它们却不约而同地选择了缄口不言,这是为何?

对越反击战期间,先前有 15 个国家明确站队支持越南,然而战争正式打响后,它们却不约而同地选择了缄口不言,这是为何?

史海孤雁
2025-12-19 17:46:17
14年前,用全部积蓄买下10万个比特币的新东方老师,如今现状怎样

14年前,用全部积蓄买下10万个比特币的新东方老师,如今现状怎样

一盅情怀
2025-12-11 14:06:19
隐忍24年,陈婷终于撕下完美伪装,她给所有“已婚女人”上了一课

隐忍24年,陈婷终于撕下完美伪装,她给所有“已婚女人”上了一课

近史谈
2025-12-27 13:49:49
i茅台春节前调整飞天茅台日购限额 ,每人每日最多可购6瓶

i茅台春节前调整飞天茅台日购限额 ,每人每日最多可购6瓶

潇湘晨报
2026-01-03 20:39:14
5国已结盟,高市选好新战场,中方接下战书,日企全面退出5G基站

5国已结盟,高市选好新战场,中方接下战书,日企全面退出5G基站

史智文道
2026-01-01 19:40:03
被处决毒枭要水喝,3停5口是17年前教的暗号:我是卧底,有内鬼!

被处决毒枭要水喝,3停5口是17年前教的暗号:我是卧底,有内鬼!

星宇共鸣
2025-12-29 09:56:33
卖给越南一度电三四毛惹争议

卖给越南一度电三四毛惹争议

辣条叨叨叨
2025-12-29 02:52:56
西方媒体:哪怕中国全力以赴,也不可能按时建成这样庞大的工程

西方媒体:哪怕中国全力以赴,也不可能按时建成这样庞大的工程

乐享人生风雨
2025-12-28 04:19:13
太突然,甘肃一大公司破产,曾是甘肃龙头企业!

太突然,甘肃一大公司破产,曾是甘肃龙头企业!

精彩武威
2026-01-03 09:07:26
上海95-90宁波取6连胜,张镇麟20分,古德温18+4+9,辛普森空砍30分

上海95-90宁波取6连胜,张镇麟20分,古德温18+4+9,辛普森空砍30分

懂球帝
2026-01-03 21:45:19
62岁云南奶业协会会长、云南农大教授黄艾祥突发疾病逝世

62岁云南奶业协会会长、云南农大教授黄艾祥突发疾病逝世

澎湃新闻
2026-01-03 18:42:27
【2026.1.3】爆姐的饭后爆料:生命不止,爆料不息!

【2026.1.3】爆姐的饭后爆料:生命不止,爆料不息!

娱乐真爆姐
2026-01-03 23:16:09
法国外长:美国对委内瑞拉的军事行动违背国际法原则

法国外长:美国对委内瑞拉的军事行动违背国际法原则

界面新闻
2026-01-03 23:37:16
中国人最爱的养生方式,正在疯狂致癌

中国人最爱的养生方式,正在疯狂致癌

十点读书
2026-01-03 18:38:01
鹿晗被曝床照后续:业内曾暗示他和关晓彤有娃,难怪女方狠心分手

鹿晗被曝床照后续:业内曾暗示他和关晓彤有娃,难怪女方狠心分手

古希腊掌管月桂的神
2026-01-03 12:36:42
中国对战争的“畏惧”:怕的不是战争,而是怕老百姓再过苦日子!

中国对战争的“畏惧”:怕的不是战争,而是怕老百姓再过苦日子!

抽象派大师
2025-09-15 07:22:26
香烟热度榜!烟民贡献万亿税收,年度销冠竟是这个品牌…

香烟热度榜!烟民贡献万亿税收,年度销冠竟是这个品牌…

慧翔百科
2025-12-24 09:14:14
现场惨不忍睹!乌军在俄控区杀疯了,普京或被逼下达斩首命令

现场惨不忍睹!乌军在俄控区杀疯了,普京或被逼下达斩首命令

似水流年忘我
2026-01-03 22:01:10
2026有望爆发的十大科技趋势!(附龙头名单)

2026有望爆发的十大科技趋势!(附龙头名单)

林子说事
2026-01-02 15:36:28
2026-01-04 00:16:49
量子位 incentive-icons
量子位
追踪人工智能动态
11964文章数 176356关注度
往期回顾 全部

科技要闻

比亚迪销冠!特斯拉2025年交付量跌逾8%

头条要闻

牛弹琴:美国入侵委内瑞拉 给世界带来三个血的教训

头条要闻

牛弹琴:美国入侵委内瑞拉 给世界带来三个血的教训

体育要闻

青岛西海岸官宣:郑智出任一线队主教练

娱乐要闻

司晓迪事件再升级 司晓迪称鹿晗最好

财经要闻

具身智能抢人大战:毕业一年 年薪300万

汽车要闻

奕派科技全年销量275,752辆 同比增长28.3

态度原创

艺术
本地
时尚
公开课
军事航空

艺术要闻

50亿!非洲正在建全球最大足球场,容纳11.5万人!

本地新闻

即将过去的2025年,对重庆的影响竟然如此深远

好美啊!58岁的她开挂了

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普称将干涉伊朗骚乱事件 伊朗政府发声明强烈谴责

无障碍浏览 进入关怀版