网易首页 > 网易号 > 正文 申请入驻

DeepSeek下的自研大模型如何做?一个字“卷”!

0
分享至

当前,DeepSeek掀起的“模型热”还在持续升温。

正如通信世界全媒体年初所预测的,2025年大模型乃至智能体将迎来进一步繁荣,行业大模型将深度融入核心业务与应用、AI终端以及智能体将加速落地。具体到如何实现,DeepSeek仿佛一阵“及时雨”,凭借低成本、高效能以及广泛的应用场景,为行业实践提供了良好的技术支撑与应用基础。

可喜之余,对于渴望在未来大模型领域闯出一片天的企业来说,结合自身的业务需求与数据特点,在充分发挥DeepSeek优势之上,“卷”出更具有独特竞争力的自研大模型乃至智能体,似乎更值得深思。

01

前期“卷”接入

实现“共进共生”

最直观来看,目前DeepSeek掀起的“模型热”主要表现为DeepSeek的“接入热”。

其中既包括英伟达、亚马逊以及微软等国外科技巨头,也包括极具市场潜力的中国本土企业,从底层的软硬件设计研发企业到互联网大厂、运营商、垂直领域AI公司再到中小型初创企业,选择DeepSeek似乎已成为当下算力成本飙升与商业化路径尚未明晰的必然抉择。

自DeepSeek开放API以来,其生态版图快速扩张。据不完全统计,目前全球已有超过200家企业宣布接入DeepSeek。就目前来看,接入方式主要分为三类:一是API直接调用,即企业直接调用DeepSeek的云端API,快速集成其通用能力,如文本生成、代码编写等。二是模型微调即企业基于DeepSeek基座模型,注入私有数据进行领域适配,从而实现自身模型优化。三是开源共建,这主要体现在底层架构与设计层面,企业针对DeepSeek开放的部分模型权重,借助社区协作进行自身优化。

总体来看,接入是方式,优化是目的。随着企业对接入方式的逐渐深入,我们可以发现,企业自研模型与DeepSeek的接入部署,逐渐呈现出全面化、智能化、差异化的特点,两者结合的模式也逐渐呈现“共生进化”特征。

针对功能补充类,调用API逐渐深入到应用场景接入,例如三大运营商在云能力率先接入的基础上,已逐渐拓展至to B端、to C端的特色场景与产品服务;多家车企探索将DeepSeek接入智能座舱,实现语音助手功能升级、AI多语义指令识别等。

针对模型部署开发类私有化部署与产品成为保障安全的选择,多家企业如中国电信、联想、新华三、浪潮等均推出了DeepSeek智算一体机,实现一体化开箱即用的私有化部署。与此同时,DeepSeek模型私有化部署服务也涵盖安装部署、系统调优和运行维护,可提供适配多种算力的部署包及支持,帮助企业在自有业务场景中构建安全可靠的智能环境。

针对技术融合类,单向的知识蒸馏训练,即单纯接入DeepSeek,可提炼其模型能力至自研模型,降低自身部署成本;多向的模型联合训练,即企业自研大模型与DeepSeek大模型进行深度联合训练,可以促进联合创新,为企业带来更广阔的发展空间。

02

中期“卷经验

挖掘价值站稳市场

接入与优化满足当前初步部署应用的需求,但也不可否认,DeepSeek的崛起为自研通用大模型以及行业大模型带来了冲击。

在技术竞争方面,DeepSeek的低成本训练模式和高效推理能力是其优势所在,也为自研大模型带来了新的技术竞争压力。就拿DeepSeek V3来说,其训练成本仅为557.6万美元,使用 2048 张 H800 GPU 卡,相比同等规模的模型(如GPT-4、GPT-4o、Llama 3.1),训练成本大幅降低。这迫使大模型研发者不得不重新审视技术路线,加大在降低训练成本和提升推理效率方面的研发投入。

在应用场景拓展方面DeepSeek-R1在科研、数据分析、代码生成等复杂场景表现出色,DeepSeek-V3适合内容创作、长文本生成等场景。客观来看,这两类大模型已较为广泛地覆盖了当下通用大模型的应用场景,行业开始出现了新的选择,即对已入局者以及仍观望者亮出了新挑战。

在市场格局重塑方面DeepSeek的开源和低成本特性,吸引了大量合作伙伴,包括云服务厂商、算力企业等,改变了通用大模型的市场格局。对于行业大模型来说,强调其自身价值之前,似乎必须先证明自己模型对行业专属数据与场景的理解,比直接调教通用模型懂得更多。

基于此,对于企业自研大模型来说,想要在市场继续站稳脚跟,正视挑战与机遇,扬长避短、提升差异化竞争力迫在眉睫。

面向低成本、低算力部署趋势大模型行业应借鉴经验,与自身结合的基础上更倾向于研发和应用能够在低成本、低算力条件下运行的技术和模型,以降低使用门槛、扩大应用范围。

面向当下训练需求逐渐转向推理需求充分挖掘数据价值有望使部分企业脱颖而出。对此,企业应重视数据质量的提升,解决数据孤岛问题,加强数据的整合和共享,借助日渐先进的数据处理技术和算法,充分挖掘数据的价值,为大模型优化提供有力支持。

证明自研大模型存在的必要企业仍需挖掘自身的差异化优势,结合自身所在行业的特点和资源,找到独特的应用场景和价值点,实现差异化竞争。例如,猿辅导的猿力大模型在与DeepSeek融合后找准了教育场景下的个性化学习体验,通过定制化学习方案,并自动调整学习节奏,使孩子逐渐找到学习自信。

03

后期“卷效用

兼顾效率与商业化

随着大模型出现并渗透进日常生活,大模型竞争也进入2.0阶段,从长远来看,大模型已由传统的技术竞赛转向商业化效率竞争。

就行业启示来看,低成本推理成为刚需随着市场竞争的加剧,算力成本曲线已然成为决定市场格局的关键因素。数据闭环能力成为新价值不同于单纯追求数据量,当下更为数据的内容质量以及应用质量。

从效率角度出发企业应全方位提升模型的研发、训练与应用效率。首先,在研发环节,企业可以尝试在算法和架构设计下功夫,同时借助自动化代码生成工具,减少人工编写代码的时间和错误。其次,在训练过程中,合理利用分布式计算技术,优化训练算法值得探索。最后,进入应用阶段,注重推理效率提升,借助模型压缩等先进技术与经验,提高推理速度。

从商业化角度出发企业应精准定位市场需求,制定合理的商业模式。一方面,企业可以针对特定行业的需求,开发定制化的大模型解决方案。另一方面,企业可以将大模型作为基础平台,开发一系列的应用产品和服务。

以运营商为例,凭借其自身庞大的用户数据资源,可以充分发挥自身的网络和服务优势,优化迭代一系列to C端的应用产品和服务。例如:基于自然语言处理大模型优化智能客服系统、5G新通话应用以及AI智能助手等,并且根据用户的使用习惯和历史数据,为用户提供个性化的服务推荐,从而增强用户黏性,挖掘存量市场。

总而言之,大模型2.0时代已经来临,低成本推理、差异化竞争、数据价值挖掘以及产业链定位,构成了这个时代大模型企业发展的关键拼图。企业有待将这些要素紧密结合,积极调整战略,以适应时代的变化,在市场竞争的洪流中稳步前行,不断发展壮大。

对DeepSeek的“冷思考”:高光背后的理性审视

总编视点 | DeepSeek打了谁的脸?

锐评DeepSeek“朋友圈”:芯片巨头、算力狂魔、模型卷王竟在偷偷组队?

作者:包建羽

责编/版式:王禹蓉

审校:王 涛 梅雅鑫

监制:刘启诚

【通信世界新媒体矩阵】

央视频 | 微软MSN | 视频号 | 微博 | 今日头条 | 百家号 | 网易号 | 搜狐 | 腾讯新闻

新浪看点 | 雪球号 | 抖音 | 快手 | 爱奇艺 | 知乎 | 哔哩哔哩 | 咪咕视频 | CSDN | 36氪

【新媒体团队】

监制|刘启诚

审校|王涛 梅雅鑫

编辑|王禹蓉

视频制作|盖贝贝 黄杨洋 卢瑞旭 蒋雅丽

运营|林嵩

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
马克龙:首批法国士兵已抵达格陵兰岛

马克龙:首批法国士兵已抵达格陵兰岛

新京报
2026-01-15 20:48:25
全世界都在静静等待,战争可能很快到来

全世界都在静静等待,战争可能很快到来

牛弹琴
2026-01-14 07:46:19
11国站队,特朗普信心十足,当众向中国喊话,必须给美国一个面子

11国站队,特朗普信心十足,当众向中国喊话,必须给美国一个面子

文史旺旺旺
2026-01-14 19:19:07
迫于欧美的压力,伊朗政府宣布暂停处决

迫于欧美的压力,伊朗政府宣布暂停处决

一种观点
2026-01-15 08:56:47
1983年,黄永胜弥留之际苦求一事,中央特批:满足他

1983年,黄永胜弥留之际苦求一事,中央特批:满足他

寄史言志
2026-01-14 16:36:19
因公牺牲的贺娇龙坠马频率及危害远超奥运 她为了宣传效果太拼了!

因公牺牲的贺娇龙坠马频率及危害远超奥运 她为了宣传效果太拼了!

劲爆体坛
2026-01-15 01:43:04
51:50,美参议院否决限制特朗普战争权议案,万斯投出关键一票!美国完成首批委内瑞拉石油销售,价值5亿美元;委代总统证实同特朗普通话

51:50,美参议院否决限制特朗普战争权议案,万斯投出关键一票!美国完成首批委内瑞拉石油销售,价值5亿美元;委代总统证实同特朗普通话

每日经济新闻
2026-01-15 12:59:39
章泽天的新播客,干翻了“高知人设”

章泽天的新播客,干翻了“高知人设”

文娱先声
2026-01-15 17:35:18
47岁贺娇龙抢救细节太催泪,生前曾一语成谶,和丈夫常分隔两地

47岁贺娇龙抢救细节太催泪,生前曾一语成谶,和丈夫常分隔两地

古希腊掌管松饼的神
2026-01-15 11:14:09
崇明有望今年年底通地铁!在长兴岛有1站,崇明本岛有3站,2029年还要通高铁

崇明有望今年年底通地铁!在长兴岛有1站,崇明本岛有3站,2029年还要通高铁

随申Hi
2026-01-15 18:49:08
关灯吃面?48000万股牢牢封死跌停板:250亿资金惨遭闷棍…

关灯吃面?48000万股牢牢封死跌停板:250亿资金惨遭闷棍…

新浪财经
2026-01-15 17:13:16
纪实:南京杀妻案吉星鹏被判处死刑,临刑前全身抽搐流泪不止

纪实:南京杀妻案吉星鹏被判处死刑,临刑前全身抽搐流泪不止

谈史论天地
2026-01-14 12:55:03
24分大胜!杨瀚森22+7+3,赛后小杨走到对方替补席,逐一握手致意

24分大胜!杨瀚森22+7+3,赛后小杨走到对方替补席,逐一握手致意

担酒
2026-01-15 12:10:16
痴人说梦:俄高层要求4月前拿下顿巴斯,世界最先进战车入列乌军

痴人说梦:俄高层要求4月前拿下顿巴斯,世界最先进战车入列乌军

史政先锋
2026-01-13 19:34:38
毛主席秘书隐藏身份秘密做11年护士,建国后接到通知:前往中南海

毛主席秘书隐藏身份秘密做11年护士,建国后接到通知:前往中南海

大运河时空
2026-01-14 11:15:03
广东云浮一学生上午匿名投诉学校下午就被找到?网友质疑隐私泄露,学校:谣言,已报警

广东云浮一学生上午匿名投诉学校下午就被找到?网友质疑隐私泄露,学校:谣言,已报警

潇湘晨报
2026-01-15 16:19:25
特朗普称“阻挠达成俄乌和平协议的人是泽连斯基”,克宫回应

特朗普称“阻挠达成俄乌和平协议的人是泽连斯基”,克宫回应

环球网资讯
2026-01-15 19:39:13
1999年东风导弹泄密,台湾女特工潜伏京都顶级夜总会,拉总工下水

1999年东风导弹泄密,台湾女特工潜伏京都顶级夜总会,拉总工下水

干史人
2026-01-12 11:27:38
寒潮预警!济南降雪降温最新预报:全市将有中到大雪,19日至22日将出现持续低温天气,局地最低温-20℃

寒潮预警!济南降雪降温最新预报:全市将有中到大雪,19日至22日将出现持续低温天气,局地最低温-20℃

鲁中晨报
2026-01-15 17:55:18
台湾传来两个好消息:绿营柯建铭反水,郑丽文对“蓝皮绿骨”开刀

台湾传来两个好消息:绿营柯建铭反水,郑丽文对“蓝皮绿骨”开刀

文史旺旺旺
2026-01-14 19:40:17
2026-01-15 21:32:49
通信世界 incentive-icons
通信世界
多维度 全媒体 整合传播
12159文章数 30433关注度
往期回顾 全部

科技要闻

阿里最狠的一次“自我革命”

头条要闻

中央纪委全会公报发布 首现着重查处"关键少数"等表述

头条要闻

中央纪委全会公报发布 首现着重查处"关键少数"等表述

体育要闻

聂卫平:黑白棋盘上的凡人棋圣

娱乐要闻

传奇棋圣聂卫平离世,网友集体悼念

财经要闻

央行再次结构性降息0.25个百分点

汽车要闻

吉利帝豪/缤越推冠军一口价 起售价4.88万

态度原创

游戏
房产
亲子
公开课
军事航空

别浪费时间了!快来《天下贰·经典版》躺赚零花钱

房产要闻

突发!商业用房购房贷款最低首付比例下调至30%

亲子要闻

既在意料之中,又在意料之外

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美国已正式开始出售委内瑞拉石油

无障碍浏览 进入关怀版