网易首页 > 网易号 > 正文 申请入驻

清华教授孙茂松:大模型已经是AI巅峰对决的战场,成都不能缺席

0
分享至

欧洲人文和自然科学院外籍院士,清华大学人工智能研究院长聘教授、常务副院长孙茂松 图片来源:每经记者 淡忠奎 摄

“大模型已经成为目前人工智能巅峰对决的一个终极战场,如果我们没有能力去参与,这肯定是一个短板,对成都的人工智能产业发展会带来不利影响。”9月11日,第二十一届中国西部海外高新科技人才洽谈会开幕式暨天府论坛上,欧洲人文和自然科学院外籍院士,清华大学人工智能研究院长聘教授、常务副院长孙茂松分享了对ChatGPT为代表的生成式人工智能的最新观察和思考。

今年5月发布的《中国人工智能大模型地图研究报告》显示,我国已有79个10亿级以上参数规模的大模型,被外界称作进入“百模大战”时代。不论是人工智能企业,还是地方政府,都纷纷入局“新赛道”。

那么,现阶段大模型的发展逻辑是怎样的,如何才能让它“说真话”?“百模大战”时代,国内大模型企业如何才能制胜未来?像成都这样布局较晚的城市,又该如何加速塑造自己的竞争优势?孙茂松在论坛期间,接受了《每日经济新闻》记者采访。

策略:下一个词预测

“以ChatGPT为代表的生成式人工智能,这一年来火爆全球。但它的算法其实非常简单,就是一个策略——下一个词预测(自监督学习)。”孙茂松举出一个例子,就像“我昨天晚上吃了饭”这句话,可以让机器在任何一个位置停下来,比如,“我今天吃了—”,让机器预测下一个词。

人共享智能算法就会调动它内在的机制,让机器去确定应该就是“饭”,这个策略就叫自监督学习。机器可以在互联网上任意规模的语料上做这件事,进而覆盖整个互联网。在这种条件下,你给出一个上文“我昨天吃了”,它就会给出下一个词的概率分布——

比如,“吃饭”概率是4.5%,“饺子”概率是3.5%,“桌子”的概率很低,但也不至于是0,“因为有寓言说大象可能吃了桌子”。倘若上文换成“我昨天晚上吃了北京”,可能35%的概率是“北京烤鸭”。

孙茂松认为,方法看似简单,但要做到准确的估计非常难。就像我们平常去掷骰子,必须掷足够多的次数才能确定骰子每个面出现的概率。这里涉及两个关键因素,一个是骰子有6个面,但是我们词语有五六万个,也就是五六万面。更麻烦的是,上文是无限的,所以它的面实际上是两个因素相乘,“就是五六万个词,再加上几乎无限数量的上文”。

这就要依靠“三驾马车”——大模型+大数据+大算力。与此同时,AIGC(人工智能生成内容)的特点就是强大的内容生产能力,以及天马行空般的创造性。假设句子中每个位置平均有100种“合理”的字接续,则可能形成“比较通顺”的五律数量约为10^80个。

凭借强大的内容生成能力和创造性,生成式AI能够有力助推数字经济的发展,甚至可能带来产业生态的重新洗牌。比如,在内容辅助生产方面,生成式AI从商业应用到文化创意产业的应用,能够显著降低制作成本、准入门槛,显著提升生产效率、产品质量;芯片设计领域,生成式AI的使用能够强化学习优化半导体芯片设计(布图规划)中的元件位置,将产品开发周期从几周(使用人类专家)缩短到几小时。

这正是生成式AI赋能千行百业的缩影。

机会:“大地基上盖房子”

8月31日,首批通过《生成式人工智能服务管理暂行办法》备案的大模型百度文心一言、百川智能、商汤商量SenseChat宣布面向全社会开放服务。在商用之外,大模型面向普通人开放被视作人工智能产业的一个里程碑。

这不仅是面向普通人开放赋能工具、生活助手,更是意味着大模型将获得庞大规模的中文语料投喂和更丰富的原生应用场景。“大模型有点像水电,它是一种智能信息处理的一个基础设施,现在只要垂直领域需要用到信息处理,只要是数字化高度发达的应用场景,它就有可能(发挥作用)”。

就像是一个通用的底座,孙茂松告诉《每日经济新闻》记者,就像你要盖房子,它实际上是一个地基,可以在上面盖各种各样的房子。以前,相当于每个应用都要打一个自己的地基,盖一个小房子,“现在是搞了一个特别大的地基,你就只需要考虑房子怎么盖。”

这也给大模型的发展带来新的想象空间。根据IDC预测,2026年我国AI市场规模有望达264.4亿美元,2023-2026年CAGR约21.5%。而被比喻为目前阶段“A终极战场”之一的大模型,更是其中的引领性力量。

中信证券研报称,大模型是连接底层算力和上层应用的重要一环,成熟的大模型能力和生态是真正的实现涌现人工智能和未来应用端繁荣的基础,拥有更强计算和推理能力、更高通用性的大模型企业有望把握AI时代的流量入口和话语权。

从国内来看,大模型已经是人工智能企业的必争之地,“百模大战”渐成趋势。不过,孙茂松认为,“百模”也不一定多。这些大模型可以分为两类,一类是真正有实力做底座的,另一类实际上是拿别人开源的大模型去做应用训练,“这两块的‘质’是不一样的,真正有实力能和国际上PK的可能一个都没有。”

他指出,很多大模型企业都会转到垂直应用,甚至可能进入的时候就没准备要做底座,而是要做垂直领域应用,“如果进入聚焦做垂直应用,还是值的鼓励的。”大模型归根究底要落地于具体的行业应用,细分领域还有更多机会。

城市:要发挥应用场景优势

“我觉得成都的人工智能发展还是不错的,但是大模型相关的研究相对落后。我们好像一下子想不出有支团队在做大模型,这是一个短板,所以成都应该着重考虑这个问题。”孙茂松认为,成都应该主打模型,特别是大模型在垂直领域的应用,通过应用要培育一支有这种能力的科研队伍。

这是他在天府论坛上给成都开出的一剂“药引”。孙茂松告诉《每日经济新闻》记者,现在国内基础大模型主要在北京、上海、深圳等城市,要想现在来做已经有些晚。后发城市应该着重来做大模型在垂直领域的应用,这一块四川和成都是有优势的,“有很多独特的应用场景,别的地方不一定有。”

换句话说,不论是AI企业,还是竞逐大模型的城市,都应该重点把握垂直领域的机会。不久前,2023世界人工智能大会也传递出这样的信号。多位人工智能专家告诉记者,大模型是AI爆发式成长的基石,要着重引导既有大模型技术与垂直领域经济发展深度融合。

与此同时,上海市徐汇区副区长俞林伟亦指出,“全面推动生成式人工智能在医疗、金融、智能网联汽车、社交等领域率先发力,所有的行业都值得用大模型再做一遍。”在这种背景下,大模型的“应用战”成为城市无法缺席的一场角逐。

“现在大家都在争大模型,我们如果没有这方面人才,可能就会丧失一些发展机会,而且跟成都的城市地位是不符的。”孙茂松认为,这一块的短板应该尽快补上,毕竟成都是有这个实力的。像川大、电子科大等本地高校都非常发达,但是可能当地对相关领域的重视程度不够高,导致培养的(大模型)人才相对较少,“成都要跟北京、上海去比,而不是跟中游城市比”。

在他看来,有些省份或城市培养不出这样的人才,所以需要想方设法去引进人才。但成都不一样,川大、电子科大等高校水平都很高,但是可能因为历史原因做这方面研究的人相对较少。当地需要进一步提高对大模型相关研究和人才的重视程度。

“现在像美国哪些最重要的几个(大模型)公司,都还在致力于打地基,今年也已经开始努力建‘大房子’。但是这些小房子它还没顾上,成都其实可以去做不同领域的‘小房子’。这要盖好也是很有挑战性的。”他说。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
真相来了!浓眉亲承:因为锡安我才去了湖人,如果选莫兰特绝不走

真相来了!浓眉亲承:因为锡安我才去了湖人,如果选莫兰特绝不走

夜白侃球
2026-04-10 14:41:02
樊振东不是自愿弃赛的!3大隐情曝光,王皓回应引猜测,热议不断

樊振东不是自愿弃赛的!3大隐情曝光,王皓回应引猜测,热议不断

荣亭小吏
2026-04-10 15:03:48
绿营将“追杀”郑丽文,爆料称高层交代不放过一人,直到达成目的

绿营将“追杀”郑丽文,爆料称高层交代不放过一人,直到达成目的

谛听骨语本尊
2026-04-10 18:30:15
完整导弹生产线转让中国,三次相助引美俄羡慕

完整导弹生产线转让中国,三次相助引美俄羡慕

郭长包工头
2026-04-09 16:28:43
设计院的工资已经恐怖如斯?

设计院的工资已经恐怖如斯?

黯泉
2026-04-10 18:46:11
人山人海!常州接住了泼天流量…

人山人海!常州接住了泼天流量…

常州大喇叭
2026-04-11 15:45:05
随着长春亚泰2-1,深圳青年人3-0,中甲最新积分榜出炉

随着长春亚泰2-1,深圳青年人3-0,中甲最新积分榜出炉

凌空倒钩
2026-04-11 17:52:00
Type-C 接口最大的问题,是看起来已经「统一」了

Type-C 接口最大的问题,是看起来已经「统一」了

少数派sspai
2026-04-10 12:11:49
人都死了,才罚7.6万?越看越不对劲

人都死了,才罚7.6万?越看越不对劲

走读新生
2026-04-09 15:37:03
刺激!深圳有人年初买房已经赚了100万!

刺激!深圳有人年初买房已经赚了100万!

楼市灭霸
2026-04-10 13:27:25
我们并没有用40年走完发达国家200年的路

我们并没有用40年走完发达国家200年的路

文青大叔说
2026-03-13 08:13:38
4月10日俄乌最新:万斯再开黄腔

4月10日俄乌最新:万斯再开黄腔

西楼饮月
2026-04-10 16:09:59
日本降级对华关系,称中方欠日本两笔账,中方回了一句大白话

日本降级对华关系,称中方欠日本两笔账,中方回了一句大白话

一口娱乐
2026-04-11 18:27:31
到高中,你会发现:去了普通高中,基本就跟985、211没什么关系了

到高中,你会发现:去了普通高中,基本就跟985、211没什么关系了

好爸育儿
2026-02-03 17:51:04
武警部队原副政委蒋金锵将军逝世,享年91岁

武警部队原副政委蒋金锵将军逝世,享年91岁

澎湃新闻
2026-04-11 15:26:26
为了对抗中国车企的极致效率,丰田不再为“看不见的完美”买单

为了对抗中国车企的极致效率,丰田不再为“看不见的完美”买单

澎湃新闻
2026-04-10 19:34:06
4-0!西汉姆联赢下保级生死战+主场5轮不败 正式将热刺送入降级区

4-0!西汉姆联赢下保级生死战+主场5轮不败 正式将热刺送入降级区

我爱英超
2026-04-11 06:18:56
70岁后,这两个地方别去,不是迷信,是实在话

70岁后,这两个地方别去,不是迷信,是实在话

宝哥精彩赛事
2026-04-11 18:04:46
“桎梏”不要再读 zhì kù,或 zhì gào,丢不起那个人!

“桎梏”不要再读 zhì kù,或 zhì gào,丢不起那个人!

未央看点
2026-04-10 00:09:02
奉劝退休金高的老年人:回农村养老时,尽量装穷把退休金说少一点

奉劝退休金高的老年人:回农村养老时,尽量装穷把退休金说少一点

小马达情感故事
2026-04-11 19:25:03
2026-04-11 20:39:00
每日经济新闻 incentive-icons
每日经济新闻
中国主流财经全媒体平台。
1535333文章数 2725254关注度
往期回顾 全部

科技要闻

半夜被燃烧瓶砸醒,OpenAI CEO发文反思

头条要闻

美国否认同意解冻伊朗资产 巴官员:美方急了 伊朗不急

头条要闻

美国否认同意解冻伊朗资产 巴官员:美方急了 伊朗不急

体育要闻

换帅之后,他们从降级区冲到升级区

娱乐要闻

浪姐7淘汰 该走的没走,不该走的走了

财经要闻

从日本翻身看:这次谁能扛住高油价?

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

家居
艺术
旅游
本地
公开课

家居要闻

复古风格 自然简约

艺术要闻

从1984到2024,9届全国美展油画最高奖作品

旅游要闻

女子一天内爬两次华山 景区打来电话关心!

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版