网易首页 > 网易号 > 正文 申请入驻

专访|欧阳万里:场景数据短缺,AI落地退回老路?

0
分享至

2025年,大模型继续狂飙。我们目睹了AI无处不在,一种深刻的转变也正在发生。

大模型告别了盲目堆砌参数的“大力出奇迹”,转而追求极致性价比;GPT不再一骑绝尘,任何大模型在榜单上的领先优势不超过3个月;行业不再迷信“万能模型”,技术深度渗透后的价值导向植入人心。AI突破数字世界的边界,“伸手”触碰物理世界。

当我们为AI的突飞猛进欢呼时,也需要清醒地审视前路。“AI泡沫”论调甚嚣尘上,真正的技术融合远比想象复杂,从技术突破到产业深耕,其间横亘着数据、可靠性、投资回报等诸多沟壑。

上海人工智能实验室领军科学家欧阳万里日前在接受澎湃科技专访时表示,都说人工智能进入了“下半场”,实际上通用人工智能(AGI)还未到来,未来几年能否到来仍不确定。即使未来一年仍能实现线性增长,这已相当不易,但仍达不到工业场景需求。

短板在于,大模型看不到工业场景的数据,无法理解那些场景数据背后蕴藏的工业逻辑。通专融合能够更好地理解数据,通专融合之下的语言模型能够与科学数据交互对齐,理解并表达DNA和蛋白序列中的信息,支撑人工智能形成自主的科学发现。

数据是模型取得更好效果的基石之一,模型设计同样重要,必须两条腿走路。欧阳万里畅想,“未来可以期待模型学习的新方法,不见得Transfomer就是最好的模式。”

以下是对话实录:

大模型开发齐头并进,工业场景大门难叩开

澎湃科技:如何评价这一年来国内外AI的发展?

欧阳万里(上海人工智能实验室领军科学家):大模型的研发在持续推进,GPT不再一骑绝尘。几家公司循环地说自己是当前世界上最好的模型,这说明大模型开发正处于齐头并进阶段。中国走开源路线,国外走闭源路线,目前来看,国外的闭源模型比中国的开源模型在性能上可能要好。

大家都说人工智能进入了“下半场”,其实AGI还没有到来,未来几年能否到来也还不确定。在这样的情况下,怎么落地到场景中这件事还没有得到彻底解决。即使接下来一年还像过去一年那样实现线性增长,但应该仍然达不到实际应用需求,这是目前存在的问题。

澎湃科技:大模型落地的短板在哪里?

欧阳万里:大模型在一些应用场景已经做得很好了,我们看到了很多案例,在写论文、写稿、文生图、文生视频、文生3D方面已经做得很棒了。大家希望一个语言模型解决几乎任何问题,这个目标目前还没有实现。很多科学工程场景也不是语言模型能解决的,语言模型并不理解DNA序列、气象数据。

大模型看不到那些场景的数据,无法理解那些场景背后的工业逻辑,所以做不好。就像写代码,大模型能写好普通代码,特别擅长深度学习代码,但不是所有代码它都能写好,比如操作系统代码在网上没公开,所以大模型写不好这些专业领域的代码。

澎湃科技:如何解决这个问题?

欧阳万里:需要场景数据。现在用大量数据训练模型解决场景问题,模型的基础能力在逐步上升,但不见得解决了所有场景需求。为了落地场景,大模型需要给大模型提供大量场景数据。

澎湃科技:为什么说国外闭源模型的能力更好?

欧阳万里:通常业界会说,第一名是闭源,第二名就开源。一方面,开源就是别人可以站在你的肩膀上,把自己闭源的技术加进去,得到的模型天然就比开源模型本身好。另一方面,像谷歌这样的公司在数据方面可能也有特殊能力,获得了一些原来大家没有获得的数据,也可能找到了另一条通向Scaling law(尺度定律)的路。

澎湃科技:中美人工智能生态区别在哪?

欧阳万里:海外人工智能大模型比中国更容易挣到钱,这是非常大的区别。国内一方面不那么接受付费服务,另一方面做研究的人在付费海外的模型。

AI产生创新科研想法,推动数据共享是关键

澎湃科技:AI for Science为什么越来越受到重视?

欧阳万里:主要是大家看到AI对于科学研究在降本增效、加速实验、提升创新高度方面的潜力。OpenAI提出要做OpenAI for Science,谷歌开发了很多AI for Science的工具。在提出创新的科研想法方面,我们发现它能够产生一些人类没有想到过的idea,比如我们当时让我们的语言模型阅读2023年或以前的论文,它提出来的idea跟2024年发表在《科学》或《自然》杂志上的idea是相似的。究其原因,一方面,语言模型会产生幻觉,很可能就是因为这些幻觉产生了创新的idea。另一方面,语言模型会学习怎么提出idea,它总结过去的知识,寻找过去的问题,再提出解决这些问题的路线方式。

澎湃科技:你们现在的工作是提升大模型本身能力,还是探索模型的应用?

欧阳万里:两条路都在走。在模型的科学能力方面上海人工智能实验室有了较多进展,它能够以通专融合的方式更好地理解科学数据,语言模型和科学数据能够交互对齐。比如从大量气象数据里找到一些气象现象,并且用语言文字表达出来;能够理解并表达DNA和蛋白序列中的信息。

在模型应用方面,实验室希望人工智能形成自主的科学发现,能够产生自己的科学想法、自己做实验、做验证评估,再重新进行实验迭代。但现在还没有完善的对应工具,我们要去打造这个工具。其次,我们要去解决某一科学问题时,相应的场景数据偏少,各个实验室、科研机构有数据,但实际上很多数据是不公开共享的,中国的数据多,但形成的数据集少,这也是中美AI的一大区别。

澎湃科技:现在有没有什么好方法可以收集数据?

欧阳万里:我们也在推动数据的共享开放。一直在推进,只是中间遇到的难点还挺多,需要政府和研究机构协同推进,科研院校提供的数据要做好验证,证实数据是有用的。

澎湃科技:是否可以说,数据是目前模型能力提升最重要的问题?

欧阳万里:不能这么说。数据是模型取得更好效果的一个基石,除了数据以外,模型设计方面也很重要,要两条腿走路。

澎湃科技:接下来模型范式还会有大变化吗?

欧阳万里:未来可以期待模型学习的新方法,不见得现在的Transfomer就是最好的模式。

澎湃科技:怎么看待AI投资泡沫这件事?

欧阳万里:现在已经没有“百模大战”了,说明对于大语言模型的投资热情是在下降的。但现在AI的投资确实很大,导致支出和收入不成正比,这是目前存在的问题。但为什么现在还有很多厂商愿意投资AI?这要从背后来看,有些投资意图是防守型的,有些是进攻型的。

初创企业都希望用语言模型打出一片市场,这是进攻型的。大厂是防守型的,它并不需要一个模型为它打出一片天,它的市场已经足够大,它只要证明自己能够做得好,所以用户可以来用它的服务。比如谷歌也是防守型的,它希望用户使用Gemini来稳住自己基于搜索销售广告的搜索市场。对谷歌这样的大厂而言,它负担得起AI,但有些企业负担不起就只能退出,不再参与。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
委员建议,提高个税起征点至8000或1万

委员建议,提高个税起征点至8000或1万

中国新闻周刊
2026-03-04 14:49:13
千问多位负责人集体宣布辞职,昨天还在讨论工作计划

千问多位负责人集体宣布辞职,昨天还在讨论工作计划

超角度
2026-03-04 10:57:19
国家动真格了!不到48小时,4大名人禁言被封,没有一个值得同情

国家动真格了!不到48小时,4大名人禁言被封,没有一个值得同情

社会日日鲜
2026-03-03 05:19:50
“高速节假日免费”改“每年固定里程免费”,连续4年都有全国两会代表委员提建议,专家:短期内不具备全面落地可行性

“高速节假日免费”改“每年固定里程免费”,连续4年都有全国两会代表委员提建议,专家:短期内不具备全面落地可行性

极目新闻
2026-03-04 12:28:35
美军中东最高指挥官:对伊朗军事行动“才刚刚开始”,已打击近2000个伊朗目标

美军中东最高指挥官:对伊朗军事行动“才刚刚开始”,已打击近2000个伊朗目标

环球网资讯
2026-03-04 11:25:09
霍尔木兹海峡封锁,日本成最大输家,中国油轮顺利通过

霍尔木兹海峡封锁,日本成最大输家,中国油轮顺利通过

兵国大事
2026-03-03 17:42:58
伊朗用导弹击中美国驱逐舰

伊朗用导弹击中美国驱逐舰

每日经济新闻
2026-03-04 11:48:27
24小时大反转!两天暴涨50%今20%跌停,散户一夜亏麻,股民彻底傻眼

24小时大反转!两天暴涨50%今20%跌停,散户一夜亏麻,股民彻底傻眼

股市皆大事
2026-03-04 10:39:01
员工过年值班8天索要3倍工资 法院:每天打完卡玩手机 不支持 律师:其不符合“加班”的法定特征

员工过年值班8天索要3倍工资 法院:每天打完卡玩手机 不支持 律师:其不符合“加班”的法定特征

闪电新闻
2026-03-03 17:36:04
“160万江景房里最窒息的一幕”,炸出了多少心穷的中国家长

“160万江景房里最窒息的一幕”,炸出了多少心穷的中国家长

小椰子专栏
2026-03-03 13:02:56
以色列防长:伊朗任何新的最高领袖都将成“清除目标”

以色列防长:伊朗任何新的最高领袖都将成“清除目标”

界面新闻
2026-03-04 15:26:41
从霍尔木兹海峡到地中海,伊朗首度攻击欧盟国家

从霍尔木兹海峡到地中海,伊朗首度攻击欧盟国家

上观新闻
2026-03-04 06:57:04
“日本发愁:特朗普光顾着打伊朗,那对付中国呢?”

“日本发愁:特朗普光顾着打伊朗,那对付中国呢?”

观察者网
2026-03-04 09:06:40
美伊越打越凶,黄金反而暴跌,有人提前知道了什么?

美伊越打越凶,黄金反而暴跌,有人提前知道了什么?

热辣茉莉说
2026-03-04 12:02:48
锦江饭店被收归国有后,创始人董竹君惨遭除名,96岁时仍在奔走

锦江饭店被收归国有后,创始人董竹君惨遭除名,96岁时仍在奔走

史之铭
2026-03-03 22:44:25
“首次证实”!美海军陆战队向示威者开火

“首次证实”!美海军陆战队向示威者开火

环球时报国际
2026-03-03 22:57:28
短短2天,央媒3次点名孙颖莎,释放三大信号,王曼昱真没说错

短短2天,央媒3次点名孙颖莎,释放三大信号,王曼昱真没说错

面包夹知识
2026-03-03 17:09:10
伊朗外长宣布革命卫队已经事实独立

伊朗外长宣布革命卫队已经事实独立

远方青木
2026-03-04 00:29:55
吴中纯于2026年2月25日离世。

吴中纯于2026年2月25日离世。

东方不败然多多
2026-03-04 02:13:38
开眼了!NBA历史首次!一支球队吃掉整个西部所有荣誉....

开眼了!NBA历史首次!一支球队吃掉整个西部所有荣誉....

柚子说球
2026-03-04 09:39:24
2026-03-04 15:43:00
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
880152文章数 5088621关注度
往期回顾 全部

科技要闻

多位核心离职,阿里亲手废掉最强AI天团?

头条要闻

哈梅内伊次子被指将"接班" 母亲妻儿妹妹妹夫均遇难

头条要闻

哈梅内伊次子被指将"接班" 母亲妻儿妹妹妹夫均遇难

体育要闻

2026年中超,为什么值得你多看一眼?

娱乐要闻

迪丽热巴转机滞留迪拜 错过巴黎时装周

财经要闻

谈扩内需等 人大新闻发布会回应这些热点

汽车要闻

续航更长/实用性升级 方程豹钛3/钛7闪充版3月5日亮相

态度原创

艺术
健康
房产
亲子
公开课

艺术要闻

2025“情系塔里木”美术作品展

转头就晕的耳石症,能开车上班吗?

房产要闻

400组,30套!聚亿·椰海锦程为何能在春节火出圈?

亲子要闻

新年快乐,祝大家健康平安,心想事成

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版