网易首页 > 网易号 > 正文 申请入驻

我们问专家怎么看DeepSeek?专家:等我问问DeepSeek

0
分享至

在全球AI竞赛白热化的今天,中国杭州的深度求索人工智能基础技术研究有限公司的DeepSeek大模型以“低成本、高效能、开源性”技术标签,成为搅动全球AI行业格局的关键力量。

DeepSeek发布以来,不仅在全球开源模型的性能测试中位列榜首,即使与最先进的OpenAI o1等闭源模型在性能上对标也不分伯仲,更关键是训练成本仅有OpenAI十分之一,性能上却能实现90%以上对标,甚至在数学推理、代码生成等垂直任务中超越国际顶尖闭源模型。

这一突破背后究竟隐藏着怎样的技术创新逻辑?低成本与高效能又是如何兼得?这对全球AI产业将带来哪些深远影响?近日,中国人工智能学会机器博弈专委会主任、重庆理工大学教授张小川接受上游新闻记者采访时,将这些问题输入DeepSeek,通过人与AI共创的形式,解读其底层技术密码。

提问:为什么说DeepSeek的计算架构是一次混合架构革命?

DeepSeek:传统大模型基本都采用谷歌Transformer计算架构,其对算力、电力、时间的消耗极其惊人;而DeepSeek创造性采用可扩展的混合专家系统(Scalable MoE),使用动态专家路由算法与稀疏计算深度融合的创新架构。简单来讲,DeepSeek自建专家小组,从而提升效率并降低能耗。例如,面对“今天星期几?”这样简单问题,实际上大模型仅需极少算力支持即可,只有面对求解“DeepSeek对全球AI将带来哪些深远影响”复杂问题时,才需动用大算力支持。这时,DeepSeek可以自动建立逻辑推理、法规检索、语义分析等临时性专家组及其任务链,不再调用其它算力。这种灵活架构使模型效能得到极大提升。

DeepSeek独创多层级“教师-学生模型”协作框架的知识传承“知识蒸馏”新机制,实现了实时动态关闭无关的模型参数,将万亿参数模型的知识密度有效迁移至千亿级模型。这种分布式计算架构,既建立了高效的负载均衡策略,将计算任务分散到多节点且并行处理,这样既加快了训练速度,又降低了单节点计算负担及其对单一芯片高性能的依赖,并采用高效压缩算法压缩数据,从而显著减少数据存储、传输的压力。这样就能显著降低对高性能芯片、大容量存储器和超带宽传输的依赖程度,进一步压缩了训练和使用成本。

张小川:大模型学习能力生长过程有点类似学校的知识传承,不同学校、不同老师会有不同的传承方法。DeepSeek设计了“以大教小”知识传承机制,这犹如使用知识、经验更丰富的教师(大模型)来训练学生(专家模型)一样,构建了多层级“师-生模型”协作框架,将万亿参数模型的知识密度有效迁移至千亿级模型。在南京大学联合实验室测试中,这种模式运作下的知识保留率达到98.7%,证明了该机制的知识传承效率极高。

提问:从“堆芯片”到“拼效率”,DeepSeek如何实现算力成本控制?

DeepSeek:面对只能使用性能受限的阉割版芯片现状,DeepSeek难能可贵的不是简单使用英伟达芯片及其CUDA技术,而是深入到硬件指令层,进行重构和优化。比如,并没有使用其他大企业所使用的FP16技术,而是使用基于8位浮点数的FP8混合精度训练技术,尽管训练精度较低,但是能够大幅降低训练成本和降低对GPU显存的占用,从而极大提高训练速度。这种建立在系统视角的优选方案,即使是使用了位数更少的浮点数来训练模型,却能在效果提升、成本降低上达到最优,这就是在大模型前沿探索的方向性引领与应用示范。

DeepSeek团队通过三项关键技术,突破了训练成本瓶颈:一是异构计算感知的分布式框架,通过自动识别GPU/TPU/国产芯片特性,动态分配计算任务,使千卡集群利用率从行业平均50%提升至85%;二是智能数据引擎,基于强化学习的训练样本筛选系统,仅用30%的数据量即可达到全量数据90%的模型效果;三是渐进式课程学习,通过模仿人类学习曲线,先学习高频简单模式,再攻克长尾复杂案例,训练周期缩短40%。此外,DeepSeek还创新了自监督数据增强技术,模拟人类联想机制,自动生成高质量合成数据,实现AI训练AI,极大降低了对数据标注需求,且保证了训练性能。

张小川:由美国引领的大模型领域,一直鼓吹大模型是大算力、大数据的“烧钱”竞争,为限制他国发展,制定了严格的“护城河”,我国自然成为其优先针对国家。因此,我们需要创立新赛道,打破美国“垒芯片”“堆算力”传统赛道,建立“拼效率”等新赛道。DeepSeek正是这样做的,并在最短时间内,以极低投入获得了性能上可对标国际上最先进的大模型。

提问:DeepSeek促进AI基础设施重构的重大价值是什么?

DeepSeek:DeepSeek的低成本、高性能、开源策略,极大降低AI技术的应用门槛,推动大模型转化为人人能用的“工具”。通过算法-架构-训练的全栈优化,DeepSeek使百亿参数模型的训练成本降低60%,推理延迟控制在毫秒级。更让外界意想不到的是,DeepSeek居然推出模型即服务(MaaS)和代码开源,允许按需付费调用API,而且支持私有化部署,开源多个轻量化模型,推出行业定制平台,支持客户3天内完成垂直领域模型的微调部署等等。如东莞某制造企业利用该MaaS,仅仅2周时间就开发出智能质检系统,将缺陷识别准确率从人工巡检的85%提至99.5%,投入成本不足传统方案十分之一。再如某云计算平台部署深度求索后,训练百亿参数模型的综合成本从行业平均300万美元降至80万美元等。显然,这种开放战略,正推动AI技术从集中化走向分布式创新,必将打破大模型应用壁垒,让全球的众多中小企业享受AI红利。

张小川:AI基础设施重构将更深远地影响产业标准的话语权争夺。目前DeepSeek主导的高效计算协议标准,已获全球50余家芯片厂商支持,这可能改变英伟达在CUDA生态的垄断地位。DeepSeek坚持模型开源并API开放策略,开发者可定制、优化,让更多人参与AI创新,加速全球AI技术协作及其丰富技术生态的形成,促进全球AI产业布局的多元化,提升中国AI产业全球竞争力。

对话:大模型普及后,全球面临新挑战

张小川在接受上游新闻记者采访时表示,当DeepSeek等公司推动大模型的应用开发成本降至“白菜价”后,滥用大模型的风险指数就将急剧上升。尽管DeepSeek建立了区块链、数字水印、内容溯源等治理工具,但如何在全球范围内构建协同治理机制,仍是亟待破解的难题。

人人可用、人人会用大模型,必将给人们学习、工作、生活带来便利的同时,产生不可避免的负面影响。如对正处于求学阶段的在校学生,本应该构建各种基础能力底座、培养基本技能,而科学便利地借用大模型完成作业、代码、论文等,势必产生学生能力“惰化”,这对全体教育工作者、家长提出全新挑战。

总之,这场由中国人主导的技术革命,正在改写AI发展的底层逻辑。当模型效率提升的速度超越摩尔定律,当每个开发者都能负担起智能时代的入场券,我们迎来的或许不仅是技术的进化,更是整个人类学习方式、社会认知范式、科研范式的颠覆。可以预见,随着通用人工智能AGI的到来,让AI如水电般渗透到人们生活、学习、工作、娱乐的各个角落,任何闭源形成的“护城河”,在颠覆性技术面前都是短暂的。

上游新闻记者 吴嘉雯

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
哈梅内伊“在工作岗位上殉职”:一生6次入狱,曾遭暗杀右手瘫痪

哈梅内伊“在工作岗位上殉职”:一生6次入狱,曾遭暗杀右手瘫痪

红星新闻
2026-03-01 12:13:39
阿富汗被巴基斯坦暴捶:塔利班军事依旧简陋,财政多用于宗教建设

阿富汗被巴基斯坦暴捶:塔利班军事依旧简陋,财政多用于宗教建设

黄娜老师
2026-02-27 22:32:30
让领导先走?以色列彻底改变了战争习惯,自此食肉者得三思而后行

让领导先走?以色列彻底改变了战争习惯,自此食肉者得三思而后行

寻途
2025-08-22 20:22:00
32+5+8,杜兰特无缘今日最佳,抱歉,因为你遇到100%的詹姆斯

32+5+8,杜兰特无缘今日最佳,抱歉,因为你遇到100%的詹姆斯

体育新角度
2026-03-01 15:44:26
林葳50秒命中反超三分,最后13秒被换下,亲眼见证球队被绝杀

林葳50秒命中反超三分,最后13秒被换下,亲眼见证球队被绝杀

篮球看比赛
2026-03-01 14:48:41
小菲回应,玥儿已转学两年!但不是他转的!现在的学校轻松没作业

小菲回应,玥儿已转学两年!但不是他转的!现在的学校轻松没作业

悠悠说世界
2026-03-01 08:14:17
金正恩一句话让全球震惊,韩国颤抖,中方第二天就出面发声

金正恩一句话让全球震惊,韩国颤抖,中方第二天就出面发声

来科点谱
2026-03-01 09:23:49
伊朗前王储巴列维宣布将返回伊朗领导革命

伊朗前王储巴列维宣布将返回伊朗领导革命

一种观点
2026-01-19 19:36:11
阿丹:我赶上最后几趟航班撤离伊朗,现在已与俱乐部断联

阿丹:我赶上最后几趟航班撤离伊朗,现在已与俱乐部断联

懂球帝
2026-03-01 07:40:47
王曼昱赢了球,却用一句话让对手红了眼眶!这才是大将风范!

王曼昱赢了球,却用一句话让对手红了眼眶!这才是大将风范!

眼界纵横
2026-02-28 20:58:39
中国马拉松进入205时代!最强00后丰配友打破何杰纪录

中国马拉松进入205时代!最强00后丰配友打破何杰纪录

全景体育V
2026-03-01 10:23:24
妈妈比女儿有气质有味道系列!

妈妈比女儿有气质有味道系列!

贵圈真乱
2026-03-01 12:10:43
王皓爆粗!鼓励林诗栋:你要XX想肯定能赢他,要有斗志,要敢抽他

王皓爆粗!鼓励林诗栋:你要XX想肯定能赢他,要有斗志,要敢抽他

风过乡
2026-03-01 12:30:03
胡锡进评哈梅内伊事件引群嘲,骑墙发言惹网友吐槽,事后诸葛亮!

胡锡进评哈梅内伊事件引群嘲,骑墙发言惹网友吐槽,事后诸葛亮!

眼光很亮
2026-03-01 15:56:18
500万英镑输光,住出租屋的破产冠军,对阵开劳斯莱斯的豪门公子

500万英镑输光,住出租屋的破产冠军,对阵开劳斯莱斯的豪门公子

情感大头说说
2026-03-01 13:41:53
抗美援朝一大骗局?美国藏了41年的秘密,其实是志愿军编造的

抗美援朝一大骗局?美国藏了41年的秘密,其实是志愿军编造的

历史甄有趣
2026-02-28 23:40:03
美国驻卡塔尔大使馆:“全体人员就地避难”

美国驻卡塔尔大使馆:“全体人员就地避难”

参考消息
2026-02-28 15:45:20
中国钢琴圣手,被人把痰盂扣头上,30岁与母亲弟弟吸煤气而亡

中国钢琴圣手,被人把痰盂扣头上,30岁与母亲弟弟吸煤气而亡

卷史
2026-02-28 05:06:44
16点开打!中国男篮再战世预赛,3位裁判确定,周琦不会“缺席”

16点开打!中国男篮再战世预赛,3位裁判确定,周琦不会“缺席”

体育大学僧
2026-03-01 09:57:04
结婚不到一年,娶了“白月光”的李国庆,口碑彻底反转了

结婚不到一年,娶了“白月光”的李国庆,口碑彻底反转了

萧鑟科普解说
2026-02-26 06:07:11
2026-03-01 17:00:49
上游新闻 incentive-icons
上游新闻
重庆“门户级”新闻客户端
248281文章数 584690关注度
往期回顾 全部

科技要闻

小米超跑概念车全球首秀!杀入顶豪俱乐部

头条要闻

哈梅内伊"回归天国" 美以如何确认其行踪引发内鬼猜测

头条要闻

哈梅内伊"回归天国" 美以如何确认其行踪引发内鬼猜测

体育要闻

火箭输给热火:乌度卡又输斯波教练

娱乐要闻

《江山为聘》:吴谨言陈哲远燃炸朝堂

财经要闻

中东局势升级 如何影响A股、黄金和原油

汽车要闻

理想汽车2月交付26421辆 历史累计交付超159万辆

态度原创

教育
时尚
本地
手机
亲子

教育要闻

2026年全国硕土研究生招生考试初试成绩公布

普通人穿衣不需要太复杂!颜色恰当、搭配和谐,高级又耐看

本地新闻

津南好·四时总相宜

手机要闻

小米卢伟冰官宣明日直播

亲子要闻

一起长大的岁月,我们是彼此最甜蜜的负担,也是最坚实的依靠

无障碍浏览 进入关怀版