网易首页 > 网易号 > 正文 申请入驻

GDC上DeepSeek引发热议:大模型技术上限远没有看到

0
分享至

2024年年底以来,围绕大模型有非常多讨论,其中一个声音是,技术上Scalling law(尺度定律)面临“撞墙”,大模型迭代放缓。另一方面,大模型在落地应用上也有诸多掣肘。这些话题也是刚刚过去的GDC(全球开发者先锋大会)讨论的一个焦点。

“行业非常关注产业落地,但和很多企业聊的时候,大家经常说的是,大模型适合做演示,在真正落地的时候存在着成本、效率、可靠性、稳定性和安全性等很多挑战。”上海人工智能实验室主任助理、领军科学家乔宇在大会上表示。

乔宇认为,这些讨论预示着,大模型虽然目前已经取得一定成果,但还有很多“乌云”。他判断,从2025年开始,大模型进入下一个阶段时,破解这些瓶颈的关键是创新和应用,在这方面DeepSeek带来了一些启发。

DeepSeek做的是体系化的创新,乔宇提到,“DeepSeek不仅技术系统做得好,而且将模型的架构、训练的方式和训练的框架高速并行,做体系化的优化,带来了非常大的效率提升与成本降低,语言大模型V3的训练,(成本)相当于Llama3的1/10。”

在这一基础上,乔宇补充表示,在大模型产业链上,DeepSeek所做的也只是中间模型和系统,“如果我们能将芯片、互联、框架、数据、模型、评测、应用做更好的体系创新,这里面会有更大的空间,一方面将模型做得更强,一方面也可以将效率做得更高”。

在接受采访时,上海人工智能实验室青年科学家何聪辉认为,DeepSeek所做的事情一定程度上打开了大模型当前的一些瓶颈。“它让整个训练成本降下来了,会让更多的研究者能参与进来,另一方面,将强化学习直接引入到后训练的这个阶段,也会促进很多科学方面的探索,且它本身很强的推理模型,也可以作为一个研究科学发现很好的起点。”

此前,数据语料的缺乏,被认为是Scalling law“撞墙”、迭代放缓的核心原因。“互联网上的人类语料是基本原料,已经耗尽了,虽然模型变大了,但是输入没有变得更多,无法学习新知识。”一位从业者对记者表示。

何聪辉长期研究大模型的数据语料方面,他对记者表示,“现在说的数据用完了,更多是说已知的一些公开数据模型都见过了,但其实并没有充分利用起来,质量还有持续提升的空间,还没有到头。”

何聪辉表示,质量的提升能够让数据的效率更高,模型可能不需要那么多数据,这样会带来进一步的计算成本降低,并进一步带动越来越多人进来优化它。

在另一场论坛上,MiniMax副总裁刘华也在演讲时提及大模型“撞墙”这一话题,他更多认为,现在的大模型处于快速的发展阶段,原因在于,2024年底Open AI推出了o1,这意味着在推理阶段大模型还在“scaling Law”,随着DeepSeek 1月的开源,大家又更熟悉了什么是强化学习。

“这一切的一切都没有结束,未来两到三年,类似GPT3.5到GPT4这样的技术再发生两次是高度可预期的。”刘华的判断是,未来两到三年大模型会飞快地发展,技术上限远没有看到。

对于未来,业界目前相对较为乐观。乔宇认为,2025年有三方面值得关注的事情,包括更多的多模态智能涌现,以及AI助力科学发现等。

在过去一两年中,多模态在语言上取得突破之后,对图像、视频、音频等的多模态引入,行业期待非常高,但现在很多的模态只是在对齐理解有进展,真正像语言一样的涌现能力,将生成理解相结合,能够从多模态中间发现知识的能力还非常有限。乔宇认为,2025年这方面或许会有值得期待的进展。

其次,在“AI4S”相关的科学智能方面,是未来人工智能的高价值区域,人工智能不应该简简单单陪我们聊聊天、画画,更多的是帮人类进行知识发现。

“我们有了AlphaFold这样单点的巨大成功,但是人工智能的潜力绝对不在于专项智能,而是如何能够实现从科学假设的提出,到实验的设计,甚至包括实验的自动化完成,以及科学知识发现的全流程。”乔宇提到,期待的是,2025年AI会不会在某一个重要的科学问题突破上体现作用。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张雪峰亲手把自己送上了死路

张雪峰亲手把自己送上了死路

名人苟或
2026-03-25 06:02:57
中原消费金融为催收“买”借款人手机号码 三大运营商均中标 或涉买卖个人信息惹争议

中原消费金融为催收“买”借款人手机号码 三大运营商均中标 或涉买卖个人信息惹争议

信网
2026-03-26 19:12:37
A股,尾盘传来一个“重磅信号”,周五,或将迎来大变盘!

A股,尾盘传来一个“重磅信号”,周五,或将迎来大变盘!

夜深爱杂谈
2026-03-26 20:09:32
特变电工:公司输变电产线基本处于满负荷生产状态,公司变压器、电线电缆、电抗器等输变电产品在手订单饱满

特变电工:公司输变电产线基本处于满负荷生产状态,公司变压器、电线电缆、电抗器等输变电产品在手订单饱满

每日经济新闻
2026-03-26 19:25:48
A股第二高价股源杰科技启动“A+H” 一年内股价涨超1000%

A股第二高价股源杰科技启动“A+H” 一年内股价涨超1000%

蓝鲸新闻
2026-03-26 16:18:08
痛心!张雪峰女儿哭成泪人!再多的财富也无法填补父爱的空缺

痛心!张雪峰女儿哭成泪人!再多的财富也无法填补父爱的空缺

魔都姐姐杂谈
2026-03-26 20:54:38
石油危机一旦爆发,房子、现金、股票、黄金谁最危险?

石油危机一旦爆发,房子、现金、股票、黄金谁最危险?

蜉蝣说
2026-03-26 16:52:10
我在立陶宛住了半年,回来后整个人对波罗的海三国的认知完全变了

我在立陶宛住了半年,回来后整个人对波罗的海三国的认知完全变了

阅尽天下大事
2026-03-26 13:16:28
学医后才知道,高血压最危险信号,不是头晕,而是频繁出现4症状

学医后才知道,高血压最危险信号,不是头晕,而是频繁出现4症状

医学科普汇
2026-03-26 19:55:03
稳居西部第二!马刺三大年轻核心,已成联盟无解难题!

稳居西部第二!马刺三大年轻核心,已成联盟无解难题!

田先生篮球
2026-03-26 14:23:29
日本公布中国游客免税店2月份消费数据,真的是打脸了!

日本公布中国游客免税店2月份消费数据,真的是打脸了!

消失的电波
2026-03-26 15:20:44
正脸曝光!强闯我使馆的村田晃大3月15日刚晋升,所持刀具刃长约18厘米

正脸曝光!强闯我使馆的村田晃大3月15日刚晋升,所持刀具刃长约18厘米

中国网
2026-03-26 14:01:45
张雪峰的病,速效救心丸能救吗?

张雪峰的病,速效救心丸能救吗?

中国新闻周刊
2026-03-25 16:23:30
女子空置房2个月用水1961吨,费用近1.2万元,“水管封死水表仍走字”,水务公司拒回应

女子空置房2个月用水1961吨,费用近1.2万元,“水管封死水表仍走字”,水务公司拒回应

观威海
2026-03-26 10:39:05
20亿美元还不够!中企对巴拿马索赔涨价,巴政府内部已经乱套了

20亿美元还不够!中企对巴拿马索赔涨价,巴政府内部已经乱套了

悄悄史话
2026-03-26 14:09:05
还有谁!杨瀚森100%命中率!20+9+5打出完美一战!

还有谁!杨瀚森100%命中率!20+9+5打出完美一战!

柚子说球
2026-03-26 13:07:05
山姆曲奇礼盒紧急下架!监管部门:已立案

山姆曲奇礼盒紧急下架!监管部门:已立案

中国品牌
2026-03-26 19:00:21
突然崩了!很多人以为手机坏了!官方紧急回应

突然崩了!很多人以为手机坏了!官方紧急回应

蓬勃新闻
2026-03-25 20:00:43
惊呆了!网传某妇产医院一少妇哭求医生,改她儿子的血型鉴定书…

惊呆了!网传某妇产医院一少妇哭求医生,改她儿子的血型鉴定书…

火山詩话
2026-03-26 11:40:00
伊朗政府信息委员会主席:15点停战协议是特朗普的“又一个谎言”

伊朗政府信息委员会主席:15点停战协议是特朗普的“又一个谎言”

新京报
2026-03-25 21:29:45
2026-03-26 22:39:00
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
248301文章数 621905关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

手机
艺术
教育
房产
公开课

手机要闻

OPPO K15 Pro 系列定档,岚影呼吸灯搭配金属中框

艺术要闻

哪一座桥不是风景?

教育要闻

骂人没有杀伤力?那不是白忙活吗?

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版