网易首页 > 网易号 > 正文 申请入驻

DeepSeek是中国AI市场的“鲶鱼”?

0
分享至

2025年春节前后,DeepSeek凭借开源多模态模型Janus-Pro与DeepSeek-R1推理模型的发布,以“低成本、高性能”的颠覆性优势横扫全球市场。其开源策略不仅让开发者以API调用成本仅为GPT-4的1/30的极低成本调用顶尖模型,更打破了此前行业内对于“算力决定效用”的认知,甚至导致英伟达单日市值蒸发4.3万亿元人民币(约合6000亿美元)。

DeepSeek爆红之后,迅速迎来各行各业的“接入潮”。其AI助手在140个国家和地区的应用商店下载量登顶。随着越来越多大模型和小模型的接入,行业内也由此引发了不少争论,其中关于技术替代性和生态主导权的讨论比较激烈。

所谓“技术替代性”,是指DeepSeek通过MoE架构(混合专家模型)与FP8混合精度训练技术,将训练成本压缩至557.6万美元,仅为GPT-4o的1/18,却实现了与GPT-4o和Claude-3.5相媲美的性能。这种“算法创新+有限算力”的路径,是否意味着传统“算力堆砌”范式的终结?如果算力不再是门槛,模型训练的准入成本将大幅下降,中小企业有望基于开源模型快速开发行业应用,极大推动AI的普及。但对依赖高算力的云服务商而言,则可能意味着被边缘化的风险。

而“生态主导权”之争,则聚焦于开源代码的复刻与再开发。DeepSeek的开源成果甚至被微软、亚马逊等美国科技巨头纳入产品体系。闭源厂商担忧“开源即统治”的策略可能重构行业权力结构,形成类似Android的生态霸权,从而进一步压缩其商业利润空间。

因此,随着企业纷纷接入DeepSeek,其引发的,不仅是技术替代路径的再思考,更是生态主导权争夺的全面博弈,值得深入分析。

厂商接入DeepSeek的路径与模式

DeepSeek的开源策略如同一块磁石,吸引了从云服务商到垂直软件厂商,再到独立大模型公司的广泛接入。不同类型的厂商基于自身资源与战略需求,探索出差异化的融合路径。

数据猿对各类企业接入DeepSeek的路径和模式进行梳理和总结,从云厂商、垂直软件厂商和独立大模型厂商三类企业展开分析。

云服务商接入DeepSeek主要是进行技术整合和业务协同,作为算力基础设施的提供者,云厂商率先将DeepSeek融入自身生态,形成了“底层算力+模型服务”的双引擎模式。在接入的方式上,云厂商的接入方式有三种:

1.API直连:通过云平台直接调用DeepSeek模型。例如腾讯云HAI平台提供DeepSeek- R1等模型的服务,允许开发者一键创建API接口,直接调用DeepSeek的模型服务满足其业务需求。

2.私有化部署:这种方式主要针对安全性要求比较高的行业或企业,比如金融、政务等行业,云服务厂商一般会提供本地化部署方案。例如:中国电信天翼云凭借以“息壤”为核心的一体化智算服务体系和能力,实现昇腾芯片+MindSpore框架+DeepSeek模型全栈国产化适配,推理性能比肩国际高端GPU,从昇腾硬件、推理引擎到模型服务,实现技术链路100%国产化。

3.混合架构:有自研模型的云厂商也会采用这种融合的方式实现业务的协同,例如:阿里云PAI平台支持DeepSeek-V3、R1及蒸馏模型的一键部署,结合vLLM加速框架实现推理吞吐量的提升。

无论是哪种接入方式,DeepSeek的融入确实给云厂商带来了业务的协同发展,实现了算力资源的高效变现。例如:华为云通过昇腾910B集群优化DeepSeek推理效率,推出“ModelEngine”本地化部署工具,帮助车企大幅压缩模型加载时间

如果说云服务厂商的接入是技术整合和业务协同,那垂直软件厂商的接入则是围绕功能增强和成本优化。软件厂商将DeepSeek看作“智能引擎”,通过嵌入现有产品中,实现产品AI功能和服务的快速升级。软件厂商的接入模式也主要有三种:

1.轻量级API调用:通过简单接口调用模型能力,例如钉钉集成DeepSeek-R1的AI会议纪要功能,实现语音转文字、任务自动生成和多语言实时翻译等功能。

2.私有化定制开发:针对企业需求定制模型。例如,幂律智能基于DeepSeek-R1开发的合同审查系统,实现条款风险识别准确率的大幅提高。

3.端侧轻量化部署:在终端设备嵌入小型化模型。例如,比亚迪DiPilot 5.0引入DeepSeek-R1模型后,提升了云端和车端的AI推理能力。

对于垂直软件厂商而言,接入DeepSeek的主要目的就是降本增效,一切都是围绕着服务和成本出发。同时,也在一定程度上实现了功能差异化竞争。而对于独立大模型厂商而言,DeepSeek的爆火给他们带来了较大冲击,从目前独立模型厂商的动作看,两极分化的状况非常明显。开源的大模型厂商积极拥抱合作,而闭源的大模型厂商则开始出现赛道分化。

开源阵营与DeepSeek的合作主要体现在两个方面,一是在合作模式上,不少厂商基于DeepSeek微调自家的行业模型,从而加深了行业的深耕力度。例如:智谱AI推出“GLM-DeepSeek”金融模型,针对银行风控场景优化,某城商行使用后坏账识别准确率大幅提升。二是贡献代码反哺开源社区。例如:MiniMax开源的新一代MoE多模态训练框架,采用线性注意力机制替代传统Transformer架构,支持高达400万token的上下文处理能力,显著提升长文本场景的计算效率。而DeepSeek的MLA架构优化了资源受限场景的推理效率,双方技术路线形成互补,为开发者提供从长文本解析到高效推理的全栈解决方案。这种技术的合作和共享,吸引了越来越多的开发者参与生态建设,促进了行业的快速发展。

与开源阵营不同,闭源阵营面临的挑战更大,其中最大的挑战就是“三不够”,即:钱不够、卡不够、数据不够。在这种情况下,“AI六小虎”已经开始分化赛道,当然这并非完全因为DeepSeek的影响,更多的是资源不足下,企业不得不转而求其次。例如:百川智能再收缩和裁撤金融业务、all in医疗;零一万物放弃了原定的万亿参数 Yi-X-Large 模型训练计划,转而训练更轻量化、更具商业落地前景的 MoE(混合专家)模型 Yi-Lightning。

不得不说,在DeepSeek的影响下,独立大模型厂商的分化正在重塑产业格局,开源阵营通过生态合作快速扩张,而闭源阵营则被迫在细分领域寻找机会和生存空间。

DeepSeek重塑产业格局

从目前众多厂商接入DeepSeek的方式和对公司业务产生的影响来看,DeepSeek的开源策略和技术突破,确实改变了企业的技术选择逻辑,同时也影响了企业的业务和战略选择。但如果站在更高的维度观察和思考,DeepSeek也进一步引发产业链上下游的连锁反应,其影响已经超越了单纯的技术竞争,正逐渐演变为商业生态的重构。

首先,算法革新和开源模型降低了进入门槛,使得整个供应链下游的机会成本降低,加快了场景应用的落地。过去十年,大模型的发展依赖“算力堆砌+数据膨胀”的路径,以GPT-4为例,其训练成本约1亿美元。这种模式导致AI行业陷入“算力军备竞赛”,中小企业根本无力参与。然而DeepSeek的出现带来了“算法革命”和工程优化,前者通过MoE架构(混合专家模型)动态激活8/256个专家模块,使得硬件利用率提升4.8倍,后者通过MoE架构和FP8混合精度技术,训练成本压缩至557.6万美元(仅为GPT-4的1/18),并实现昇腾910B芯片推理效率的大幅提升。

这意味着AI的入局门槛大幅降低,算力效率大幅提高,各行各业的中小企业也将会积极参与,由此导致行业下游的企业不再被动的观望,而是可以基于开源模型快速开发应用,享受技术革新带来的好处。比如,山东寿光某农场,使用DeepSeek开发的智能灌溉系统,在节水40%的情况下,使种植的番茄增产18%。类似的行业应用落地场景在不断增加,并向更多的领域扩散。

其次,市场竞争也面临重构,大厂开始分化,创业公司“断臂求生”。对于云厂商而言,他们的发展方式出现“双轨制”,也就是“两条腿”走路:一是将DeepSeek与自研大模型结合,用户可以自由选择底层模型,比如腾讯的元宝,用户在使用时,可以选择DeepSeek或混元模型;二是将DeepSeek与当前业务协同起来,帮助客户实现降本增效。

对于垂直软件厂商而言,尽管他们没有自研大模型,但可以在现有的产品和服务中增加DeepSeek的功能,从而进一步实现与用户的深度绑定,比如用友网络在ERP系统中基于DeepSeek-R1开发的合同审查系统,实现合同条款自动解析与风险预警。

最难的就是AI行业中的创业公司,尤其是闭源厂商,在原有的“三不够”挑战没有被完全解决的情况下,开源的Deep Seek和抱团取暖的开源厂商们,已经将其逼近“悬崖边”,不少闭源厂商不得不另辟蹊径,寻找适合自己的优势领域和场景。

由此可见,无论是大公司还是中小企业,无论是云厂商还是软件厂商,对于DeepSeek的积极接入总算是没有让自己在激烈的竞争中落后。然而,对于大模型厂商而言,这场可能重塑产业格局的“风暴”可能才刚刚开始,未来大模型厂商的生存逻辑是什么?可能选择的方向在哪里呢?

大模型厂商的“十字路口”

回首2023年初,当ChatGPT问世时,全球震惊,人工智能的热潮迅速席卷全球。很快,大模型也在国内热闹起来,一时间各大科技公司纷纷宣布已经投入研发大模型,并纷纷在最短的时间内发布相关产品,引发了“百模大战”。然而,随着DeepSeek的问世,大模型企业也或多或少的受到了冲击,对于大模型企业未来发展和转型的讨论也越来越多。

第一个被热议的话题就是有了DeepSeek之后,底层模型的竞争是否还有意义?认为仍有必要的加大底层模型研发投入的人认为,首先,不同行业对底层模型的需求存在差异,而底层模型的竞争可以推动技术适配细分市场;其次,DeepSeek的成功依赖于算法优化与硬件效率的协同,但其他厂商在异构计算、边缘设备推理等领域仍有创新空间,例如,AMD通过集成DeepSeek-V3模型优化Instinct MI300X GPU推理性能,结合SGLang框架实现吞吐量提升,说明底层模型的竞争可驱动硬件生态多样化;第三,DeepSeek的开源策略虽降低了应用门槛,但单一技术路径可能抑制创新活力,例如,Meta被迫开源线性注意力框架支持400万token长文本处理,OpenAI考虑部分开源应对竞争,印证行业探索多技术路线的压力,这种压力促使行业探索更多技术路线(如多模态、跨平台整合),避免形成技术霸权。

而反对底层模型竞争的人也有三个方面的观点,首先,DeepSeek通过“低成本推理+开源生态”重构行业标准,其模型性能和成本优势形成护城河。中小厂商若重复投入底层研发,可能因资源不足陷入“无效内卷”;其次,DeepSeek的开源模式使开发者可基于其框架快速构建应用,无需从零开发底层模型。例如,腾讯元宝、百度文心等通过接入DeepSeek能力实现产品升级,说明行业重心已从底层竞争转向应用层创新;第三,在DeepSeek的冲击下,头部厂商转向商业化落地,中小厂商聚焦细分场景。这种分工模式更符合资源配置效率,底层模型的集中化可能成为常态(类似安卓系统与手机厂商的关系)。

数据猿认为,这个问题的争辩目前很难有定论,底层模型竞争的意义需分阶段看待:短期内,DeepSeek的领先地位可能削弱重复性竞争;但长期来看,技术突破仍需多元探索。行业的未来或将呈现“一超多强”格局,通用模型由头部主导,垂直领域则由专业化模型补充。

第二个被关注较多的话题是大模型厂商的转型路径选择。从目前大模型厂商的动作分析,转型的方向主要有三个:一是To B服务升级,从模型销售转向“模型+行业Know-how”解决方案;二是垂直领域深耕,聚焦长尾场景构建壁垒;三是通过开源社区运营,构建生态影响力和长尾创新。

To B服务升级:大模型厂商通过将通用能力与垂直行业知识结合,解决企业数据隐私、场景适配等核心问题,例如:阿里云与一汽合作,通过通义千问+DeepSeek混合架构,将车型开发周期大幅压缩。

垂直领域深耕:大模型厂商可以针对某些专业性强、数据敏感性要求高的行业,打造具备行业专属知识库的轻量化垂直模型,例如:医疗大模型融合医学文献、临床数据和专家经验,解决诊断与药物研发的“最后一公里”问题。这些垂直领域的大模型有两个竞争壁垒,一是数据壁垒,二是场景壁垒,双重壁垒为大模型厂商的市场竞争和商业化带来足够的保障。

开源社区运营:开源策略是优势是能够降低企业使用门卡,同时又能通过社区贡献反哺技术迭代,有利于行业的快速发展,但是它的难题在于商业化面临挑战。开源的大模型厂商需要平衡开源生态与核心商业利益,目前,OpenAI虽未完全开源GPT-4,但通过API服务与开发者形成共生关系,而DeepSeek则采用MIT协议开源,允许商业用途并推动下游应用创新。

当前大模型厂商的转型呈现三大特征:技术深度垂直化(从通用到行业专用)、商业模式分层化(基础服务免费+增值服务收费)、生态协作开放化(开源与产业链协同)。预计未来大模型的竞争将围绕着技术(多模态能力提升与边缘计算优化)、商业(探索MaaS与AI Agent集成)、政策(数据合规与开源治理体系完善)展开,而厂商需要根据自身资源禀赋选择路径,找到公司的生态位。例如,头部企业可布局全栈能力(如百度文心一体机),初创公司则需聚焦细分场景(如岩芯数智深耕金融AI)。

“后DeepSeek时代”的趋势

目前来看,DeepSeek的出现和众多厂商的接入,并非短期的热点现象,行业的发展趋势可能会因此而发生转变,其中,大模型厂商的转型发展也是“后Deep Seek时代”的短期趋势之一。数据猿认为,中国的大模型产业,正在从之前的“规模扩张”转向“价值深挖”。

短期来看,两个趋势非常明显,一是大模型行业的市场整合在加速,缺乏差异化能力的中小厂商被并购或退出,头部效应加剧。DeepSeek开源模型带来的技术普惠化显著降低了行业门槛,但也加剧了市场竞争的“马太效应”。当前,中国大模型市场已形成“头部企业主导+细分赛道差异化竞争”的格局。头部企业如阿里云、腾讯云凭借算力资源、行业数据积累和生态整合能力,加速抢占市场份额;而中小厂商若无法在垂直场景中建立技术壁垒(如医疗领域的诊断精度、制造业的实时质检能力),则面临被并购或退出的风险。例如,智谱AI等“六小虎”企业已通过聚焦政务、金融等场景的定制化服务稳固地位,而部分通用模型初创公司因同质化严重被头部企业整合。

二是政策引导强化,数据安全与国产化要求推动DeepSeek在关键行业的深度渗透。在国产化替代与数据主权强监管的双重驱动下,DeepSeek的“开源+国产芯片适配”模式成为关键行业首选。例如,华为昇腾等国产芯片厂商通过与DeepSeek的深度优化,完成适配。政策层面,国家超算互联网平台已上线DeepSeek-R1、V3、Coder等系列模型,要求能源、交通等关键基础设施优先采用国产化大模型解决方案。同时,数据分类分级与隐私计算技术的强制应用,进一步巩固了具备本地化部署能力的头部厂商优势。

站在3-5年的长期维度看,大模型的技术融合和全球化竞争仍然值得关注。技术融合方面,未来大模型将突破单一模态局限,向“多模态+边缘计算+可信机制”的融合架构演进。例如,DeepSeek R1模型已通过强化学习框架实现与物联网设备的协同推理,在智能制造场景中可实时分析生产线数据并动态调整参数。区块链技术的引入则解决了数据溯源与模型可信问题,如政务领域的合同审核系统通过链上存证确保决策透明。此外,类脑计算与神经符号系统的结合将推动大模型从“感知智能”向“因果推理”跃迁,在生物医药、材料研发等科学领域开辟新场景。

在全球化竞争方面,DeepSeek开源生态或成中国AI技术输出的核心载体,挑战Meta、OpenAI主导地位。目前,DeepSeek的开源策略正在重构全球AI技术生态。其MIT协议开源框架已吸引几十个国家开发者参与贡献,形成“基础模型开源-垂直插件商业化”的生态闭环。例如,东南亚金融科技公司通过微调DeepSeek模型快速开发本地化风控系统,而欧美企业则利用其多语言能力降低跨国服务成本。这一模式直接冲击OpenAI的API订阅制与Meta的封闭生态,成为发展中国家AI技术自主化的重要依托。

“后DeepSeek时代”的中国大模型产业,正从“规模扩张”转向“价值深挖”。短期内的市场整合与政策合规化将为行业奠定稳健基础,而长期的技术融合与全球化生态竞争,则考验着中国能否将工程化优势转化为基础理论突破。未来的AI竞争,不仅是算力与算法的比拼,更是开放协作与治理智慧的较量。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
带模特老婆养鸡18年,满脸皱纹认不出,如今搭档谭松韵终于火了

带模特老婆养鸡18年,满脸皱纹认不出,如今搭档谭松韵终于火了

揽星河的笔记
2026-03-12 12:10:40
奥特曼宣判Transformer死刑! AGI两年内降临,下一代架构已在路上

奥特曼宣判Transformer死刑! AGI两年内降临,下一代架构已在路上

新智元
2026-03-16 20:33:23
广西男子用楠木根雕出15米雄狮,富豪出价300万被拒,如今怎样了

广西男子用楠木根雕出15米雄狮,富豪出价300万被拒,如今怎样了

叹为观止易
2026-03-15 20:59:52
官宣!2026无锡马拉松也缩短关门时间!

官宣!2026无锡马拉松也缩短关门时间!

老王谈跑步
2026-03-16 19:26:07
某鱼初代“小姨子”复播,被嘲奔四老掉渣,网友:A8老了也是A8

某鱼初代“小姨子”复播,被嘲奔四老掉渣,网友:A8老了也是A8

电竞瓜皮
2026-03-15 22:09:36
后悔,勇士队主教练科尔后悔在尼克斯队失利中对理查德发火

后悔,勇士队主教练科尔后悔在尼克斯队失利中对理查德发火

好火子
2026-03-17 05:45:37
太平军被围在山顶,清军放饿狗试探,看到饿狗回来,清军马上撤退

太平军被围在山顶,清军放饿狗试探,看到饿狗回来,清军马上撤退

鹤羽说个事
2026-03-16 19:46:05
云南发现4万“野人”,衣不蔽体靠吃野果为生,到底是什么人?

云南发现4万“野人”,衣不蔽体靠吃野果为生,到底是什么人?

风信子的花
2026-03-15 22:30:48
石油危机才刚刚开始

石油危机才刚刚开始

米筐投资
2026-03-16 07:06:35
孙思邈活到141岁靠的是什么?不是晨跑也不是散步,而是这个习惯

孙思邈活到141岁靠的是什么?不是晨跑也不是散步,而是这个习惯

千秋文化
2026-03-14 18:55:05
63岁张近东:2387亿债务清零,身家散尽,南京街头三分钟背影!

63岁张近东:2387亿债务清零,身家散尽,南京街头三分钟背影!

别人都叫我阿腈
2026-03-15 21:17:02
中产抛弃又一轻奢?千元羽绒服假货满街,网友:不交智商税

中产抛弃又一轻奢?千元羽绒服假货满街,网友:不交智商税

财经八卦
2026-03-16 21:17:38
记者:皇马想在今夏送走塞瓦略斯,球员想回贝蒂斯

记者:皇马想在今夏送走塞瓦略斯,球员想回贝蒂斯

懂球帝
2026-03-17 07:37:05
拉里贾尼呼吁伊斯兰国家考虑选边站队

拉里贾尼呼吁伊斯兰国家考虑选边站队

新京报
2026-03-17 07:15:06
皇马有望第5次欧冠淘汰曼城,此前仅拜仁被同一对手淘汰超5次

皇马有望第5次欧冠淘汰曼城,此前仅拜仁被同一对手淘汰超5次

懂球帝
2026-03-17 02:17:08
仅中国独有!2026年四川一保护区首次拍到照片,专家“立大功了”

仅中国独有!2026年四川一保护区首次拍到照片,专家“立大功了”

万象硬核本尊
2026-03-15 23:06:48
开战16天!以色列怕了!

开战16天!以色列怕了!

大嘴说天下
2026-03-15 20:16:07
迪拜“地狱”监狱:一间牢房20人,强奸是家常便饭,随时会被电击

迪拜“地狱”监狱:一间牢房20人,强奸是家常便饭,随时会被电击

哄动一时啊
2026-03-09 19:26:44
西安道路改造迎来全新曝光:“西2.5环”终将启动,城南多年断头路确定打通!

西安道路改造迎来全新曝光:“西2.5环”终将启动,城南多年断头路确定打通!

荣耀西安网
2026-03-16 22:38:20
悲壮一刻!导弹拼命拦截失败,16架运输机被毁:伊朗空军全军覆没

悲壮一刻!导弹拼命拦截失败,16架运输机被毁:伊朗空军全军覆没

霁寒飘雪
2026-03-12 13:03:51
2026-03-17 07:51:00
数据猿DataYuan incentive-icons
数据猿DataYuan
数据智能产业创新服务媒体
2661文章数 604关注度
往期回顾 全部

科技要闻

黄仁勋豪言2027年AI芯片收入剑指1万亿美元

头条要闻

外媒:美国已输掉了对伊朗的战争 一个动作令中国获益

头条要闻

外媒:美国已输掉了对伊朗的战争 一个动作令中国获益

体育要闻

那个送老奶奶去医院的球员 成了队史第一人

娱乐要闻

姚晨曹郁发离婚声明 多年前已结束婚姻

财经要闻

梁文锋推迟V4,是为根治龙虾的健忘症?

汽车要闻

大众全球首款9系旗舰SUV 上汽大众ID.ERA 9X首秀

态度原创

手机
艺术
教育
家居
时尚

手机要闻

华为春季发布会新品阵容来了!问界新车、畅享新手机 还有超级直播神器

艺术要闻

一生捐赠文物3900余件,16辆卡车7天7夜运完,六莹堂主何许人也?

教育要闻

同学们,醒醒吧,别再傻傻地去打游戏了!

家居要闻

简约之美 尘埃落定

“这个颜色”今天春天又火了!这样穿好看又减龄

无障碍浏览 进入关怀版