网易首页 > 网易号 > 正文 申请入驻

清华唐杰:领域大模型,伪命题

0
分享至

编辑部 整理
量子位 | 公众号 QbitAI

清华教授唐杰最新在微博发表了自己关于AI的一些感悟,非常值得一读~

共八个小点,不算长篇大论,但扎实有料:

  • 基座模型继续scaling仍然高效;
  • 真实使用体验想进一步上台阶,长尾能力的对齐和推理增强绕不过去;
  • Agent代表模型开始进入环境、开始形成生产力;
  • 一旦模型进入持续交互的世界,记忆机制、在线学习、自我评估就会成为核心工程题,而不是可选项;
  • AI终究要落到替人完成工作、创造增量价值上;
  • 领域大模型是个伪命题;

唐杰表示,发微博是想分享一下,希望对大家有用。

兹以推文刊载,供大家广泛阅读、传播。



以下为其感悟原文:

01,关于scaling基座模型

预训练使得大模型已经掌握世界常识知识,并且具备简单推理能力。

更多数据、更大参数和更饱和的计算仍然是scaling基座模型最高效的办法。

02,关于激活对齐和增强推理能力

激活对齐和增强推理能力,尤其是激活更全面的长尾能力是保证模型效果的另一关键,通用benchmark的出现一方面评测了模型通用效果,但也可能使得很多模型过拟合。

真实场景下是如何让模型更快、更好的对齐长尾的真实场景,增强实际体感。

mid和post training使得更多场景的快速对齐和强推理能力成为可能。

03,关于Agent

agent是模型能力扩展的一个里程碑,也是体现ai模型进入人类真实(虚拟/物理)世界的关键。

没有agent能力,大模型将停留在(理论学习)阶段,就类似一个人不断学习,哪怕学习到博士,也只是知识积累,还没有转化为生产力。

原来的agent是通过模型应用来实现,现在模型已经可以直接将agent数据集成到训练过程,增强了模型的通用性,其实难题还是不同agent环境的泛化和迁移并不是那么容易,因此最简单办法也只有不断增加不同agent环境的数据和针对不同环境的强化学习。

04,关于模型记忆

实现模型记忆成为一个必须做的事情,这也是一个模型应用到真实环境必须有的能力。

人类记忆分为短期(前额叶)、中期(海马体)、长期(分布式大脑皮层)、人类历史(wiki或史书)四个阶段。

大模型如何实现不同阶段的记忆是个关键,context、rag、模型参数可能分别对应了人类的不同记忆阶段,但如何实现是个关键,一种办法是压缩记忆,简单存在context,如果大模型可以支持足够长的context,那基本有可能实现短中长期的记忆。

如何迭代模型知识,更改模型参数这还是个难题。

05,关于在线学习与自我评估

在线学习与自我评估。

有了记忆机理,在线学习成为一个重点,目前的大模型定时重新训练,这有几个问题:

  • 模型无法真正的自我迭代,但模型的自学习自迭代一定会是下一个阶段必然具有的能力;
  • 重新训练还比较浪费,同时也会丢掉很多交互数据。

因此如何实现在线学习是个关键,自我评估是在线学习的一个关键点,要想模型自我学习,模型首先要知道自己对还是不对,如果知道了(哪怕概率知道)模型就知道了优化目标,能够自我改进。

因此构建模型自我评价机制是个难题。

这也可能是下一个scaling范式。

continual learning/real time learning/online learning?

06,关于模型研发和应用结合

最后,大模型的发展越来越端到端,不可避免的要把模型研发和模型应用结合起来。

ai模型应用的第一性不应该是创造新的app,他的本质是agi替代人类工作,因此研发替代不同工种的ai是应用的关键。

chat部分替代了搜索,部分其实融合了情感交互。

明年将是ai替代不同工种的爆发年。

07,关于多模态和具身

写在最后的是多模态和具身。

多模态肯定是个未来也很有前景,当下的问题是多模态不大能帮助到agi的智能上界,而通用agi的智能上界到底在哪儿还不知道。

可能最有效的方式还是分开发展,文本、多模态、多模态生成。

当然适度的探索这三者的结合肯定能发现一些很不一样的能力,这需要勇气和雄厚的资本支持。

同理,如果看懂了agent就知道具身的痛在哪里了,太难通用了(也不一定),但至少少样本去激活通用具身能力基本不可能。

那怎么办呢,采数据,或者合成数据,都不是那么容易,也贵。

但反之一旦数据规模上去了,通用能力出来了自然会形成门槛。

当然这只是智能方面的难题,对于具身,机器人本身也是个问题,不稳定,故障频繁都限制了具身智能的发展。

2026年这些都将取得长足进步。

08,关于领域大模型和大模型应用

也讨论一下领域大模型和大模型应用。

我一直认为领域大模型就是个伪命题,都agi了哪有什么domain-specific agi……

但,agi还没实现,领域模型会长时间存在(多长,不好说,ai发展实在太快了)。

领域模型的存在本质上是应用企业不愿意在ai企业面前认输,希望构建领域know how的护城河,不希望ai入侵,希望把ai驯化为工具。

而ai的本质是海啸,走到哪里都将一切卷了进去,一定有一些领域公司走出护城河,自然就卷进了agi的世界。

简而言之,领域的数据、流程、agent数据慢慢的都会进入主模型。

而大模型的应用也要回到第一性原理,ai不需要创建新的应用。

ai的本质是模拟人或者代替人或者帮助人实现人类的某些必须要做到事(某些工种)。

可能就是两种,一种就是ai化以前的软件,原来需要人参与的改成ai,另一种就是创造对齐人类某个工种的ai软件,替代人类工作。

所以大模型应用需要帮助到人、创造新的价值。

如果做一个ai软件没人用,不能产生价值,那这个ai软件肯定没有生命力。

参考链接:
https://weibo.com/2126427211/5247011059141988

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
外交部发言人反问日媒:“你见过有人未经允许持刀进入使馆与大使交谈的先例吗?”

外交部发言人反问日媒:“你见过有人未经允许持刀进入使馆与大使交谈的先例吗?”

环球网资讯
2026-03-25 15:39:26
停炸五天的真正含义:伊朗被迫进入二选一困局

停炸五天的真正含义:伊朗被迫进入二选一困局

斌闻天下
2026-03-26 07:45:03
以色列人哭了:这不是该发生在劣等民族身上的吗?

以色列人哭了:这不是该发生在劣等民族身上的吗?

李荣茂
2026-03-23 18:59:00
53岁宁静近况曝光!29年前嫁美国演员生一子,离婚后尽享单身生活

53岁宁静近况曝光!29年前嫁美国演员生一子,离婚后尽享单身生活

代军哥哥谈娱乐
2026-03-25 11:31:55
中方驳斥“闯馆事件”日方荒谬说法:你见过未经允许持刀进入使馆同大使交谈的先例吗?

中方驳斥“闯馆事件”日方荒谬说法:你见过未经允许持刀进入使馆同大使交谈的先例吗?

环球网资讯
2026-03-26 07:09:09
我想过Sora会死,但没想到这么快。

我想过Sora会死,但没想到这么快。

差评XPIN
2026-03-26 00:04:51
4月1日医保7号令落地!1965-1985年出生的,这6件事务必抓紧办

4月1日医保7号令落地!1965-1985年出生的,这6件事务必抓紧办

混沌录
2026-03-25 15:50:11
张雪峰去世事件升级!很多人连夜下单AED,有店铺一天销售100多台

张雪峰去世事件升级!很多人连夜下单AED,有店铺一天销售100多台

火山詩话
2026-03-26 07:32:38
伊朗议长和外长被移出美以清除名单,“时限4到5天”!专家:若达成协议最慌的是以色列!特朗普:油价涨、股市跌,我无所谓

伊朗议长和外长被移出美以清除名单,“时限4到5天”!专家:若达成协议最慌的是以色列!特朗普:油价涨、股市跌,我无所谓

每日经济新闻
2026-03-26 12:20:14
经济学历巴曙松被带走调查

经济学历巴曙松被带走调查

地产微资讯
2026-03-25 20:49:47
布朗31分8板8助凯尔特人终结雷霆12连胜,亚历山大33分8助攻

布朗31分8板8助凯尔特人终结雷霆12连胜,亚历山大33分8助攻

湖人崛起
2026-03-26 10:00:59
两省省委领导班子调整

两省省委领导班子调整

上观新闻
2026-03-25 15:07:07
“住宅禁放骨灰盒”新规出炉,引争议!网友:可以去化房地产库存

“住宅禁放骨灰盒”新规出炉,引争议!网友:可以去化房地产库存

火山詩话
2026-03-26 11:11:22
原来她是张雪峰前妻,90后历史学博士‌,两人离婚后曾一起上节目

原来她是张雪峰前妻,90后历史学博士‌,两人离婚后曾一起上节目

大铁猫娱乐
2026-03-25 13:03:57
四天619次进攻、6090人伤亡:俄春季攻势为何高伤亡低战果?

四天619次进攻、6090人伤亡:俄春季攻势为何高伤亡低战果?

高博新视野
2026-03-25 08:00:28
广东一男子买啤酒抽中电动车大奖,将中奖二维码发网上询问后被他人扫走核销,网友:“这下又上了一课”

广东一男子买啤酒抽中电动车大奖,将中奖二维码发网上询问后被他人扫走核销,网友:“这下又上了一课”

洪观新闻
2026-03-26 10:56:49
“史上最惨”的成都糖酒会,彻底撕开了白酒行业的遮羞布

“史上最惨”的成都糖酒会,彻底撕开了白酒行业的遮羞布

财经早餐
2026-03-25 22:42:59
万科高管被要求退还薪酬

万科高管被要求退还薪酬

地产微资讯
2026-03-26 12:22:04
曾因污言秽语被封禁的张雪峰,凭什么让郑大悼念,新华社发讣告?

曾因污言秽语被封禁的张雪峰,凭什么让郑大悼念,新华社发讣告?

观察者海风
2026-03-25 22:10:33
美方提“15点计划”,伊朗称“又一个谎言”,美国“一边准备谈判一边握拳”

美方提“15点计划”,伊朗称“又一个谎言”,美国“一边准备谈判一边握拳”

环球网资讯
2026-03-26 06:58:33
2026-03-26 13:56:49
量子位 incentive-icons
量子位
追踪人工智能动态
12346文章数 176424关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

手机
家居
旅游
艺术
房产

手机要闻

三星One UI 9前瞻:小部件更方正、Now Bar动画更丝滑

家居要闻

傍海而居 静观蝴蝶海

旅游要闻

明起全面实行线上实名预约购票!云台山景区发布公告

艺术要闻

哪一座桥不是风景?

房产要闻

质价比标杆!三亚首创浮岛全景舱亮相,还得是万科!

无障碍浏览 进入关怀版