网易首页 > 网易号 > 正文 申请入驻

AI观察|从万元到百万元,DeepSeek一体机江湖混战

0
分享至

DeepSeek爆火让模型平权,今年以来,市面上的DeepSeek一体机可谓五花八门,有的声称可以“跑满血”,有的称可以运行70B、32B模型;有的是量化版本,有的是全精度版本;价格也是相差甚远,从几万元到上百万元都在售卖。

澎湃科技记者日前调查发现,目前DeepSeek一体机市场鱼龙混杂、打营销擦边球,降低性能就有套利空间,这也是为什么有人发现买回来的一体机变“笨”了。只要对模型进行量化或蒸馏,使用阉割版的模型,硬件资源就可以直接减半。“在这上面稍微 ‘偷’一点,价格就能看起来便宜很多,但实际使用体验会打折。”多位业内人士向澎湃科技表示,目前一体机市场存在较多信息差,行业处于早期阶段,市场秩序的建立仍需时间。

在业内人士看来,当前,大模型和业务场景结合仍处于试点阶段,DeepSeek一体机是一个过渡产品。至于后续发展,则取决于大模型能力的持续提升以及与企业业务的结合程度。

一体机很火

“现在一体机很火,每家都有自己的产品。”在4月底的第八届数字中国建设峰会的展台上,参展商蔺文强告诉澎湃科技,所有大模型都需要算力支持,算力来源无外乎向各大云厂商租赁和企业自建。如果数据不涉密,企业也不希望产生任何运维或硬件成本,上云就是一个好选择。出于对数据安全的考虑,一些业务无法上云,必须部署在本地,因此催生了DeepSeek一体机需求。

DeepSeek一体机预先安装软硬件,主打“开箱即用”,这就好比用户使用电脑做表格时,既可以选择使用Office,也可以选择使用WPS。从形态来看,有服务器级别的一体机,有台式机级别的一体机,也有体型较小的终端级别一体机。

蔺文强介绍,目前他所在的公司客户主要采购满血版DeepSeek一体机,譬如服装企业采购DeepSeek一体机用于记账和分析消费者喜好;基层乡镇会采购非满血版一体机,“一个办公室放一排,20并发就够用。我们把服务预装好,就像APP软件一样,一插电就能用。”

在另一家企业展台上,澎湃科技记者看到,其展示的DeepSeek一体机集成了安全防护软件。这些一体机面向政府、企业、高校等销售。展台工作人员介绍,以往闭源大模型使用成本高,DeepSeek开源让模型成本骤降为0,模型平权后只需采购硬件,一体机成本更低、需求增长。“目前一二三线厂商都在提供DeepSeek一体机。”该工作人员同样表示。大型计算中心承接训练需求,一体机本地化部署满足推理需求。服务器集群由多台服务器组成,而DeepSeek一体机是一种最简化配置。该企业生产的8卡满血版DeepSeek一体机的典型应用是每秒2000token、200个用户并发。“一所1万人的学校,并发峰值10%,意味着1000个学生使用,一台DeepSeek一体机就不够用了。我们目前做了好几个大项目,都是8-16台一体机供一两万名高校学生和老师使用。”

硅基流动联合创始人胡健告诉澎湃科技,DeepSeek的能力得到了验证,企业对DeepSeek的认可度提高。考虑到私有化数据的安全性,企业若采用私有化集群使用DeepSeek,现阶段算力成本仍然较高。在尝鲜阶段,轻量级的一体机对企业而言是更好的选择。如果试水成功,未来再选择上云。

满血版未必真满血

企业针对DeepSeek大模型不同参数的版本推出了不同型号的机型。一台DeepSeek一体机的主要成本集中在GPU上。目前市面上的DeepSeek一体机价格有高有低。

有的展台上,一台供个人使用的满血版DeepSeek一体机价格8.98万元;有的展台上两台满血版671B一体机售价上百万元。

所谓满血版,即671B的DeepSeek模型。目前市面上的DeepSeek一体机中,有的称可以“跑满血”,有的称可以运行70B、32B模型;有的是量化版本,有的是全精度版本。

一位AI领域创业者对澎湃科技表示,年后DeepSeek一体机随着DeepSeek大模型的出圈而火爆,由于市场发展快,目前市场信息较为混乱。“有时候说的是跑DeepSeek,但实际可能只是一个70B或32B蒸馏之后的模型。有的70B模型本质上是拿着LLaMA模型,用DeepSeek生成的数据微调,最终说话效果和DeepSeek很像。32B的模型一般用通义千问的32B模型,结合DeepSeek生成的数据简单训练。”他表示,671B的模型和32B的模型对硬件的要求至少相差一个数量级,因此造成有的一体机只需几万元或几十万元,而有的价格需要上百万元。

与此同时,业界对于“满血”的标准并不统一。上述创业者介绍,有的满血版是模型量化后的满血。DeepSeek官方公布的参数精度是FP8,即8比特参数,一台8卡A100的一体机运行原版模型尚显吃力,需要两台才能流畅运行。一些厂家为了压低成本,缩小参数,量化为4比特参数,导致用户直接感受到模型变“笨”了。即便同样是8比特参数,其中也有玄机。有的8比特参数是指INT8而非FP8。为了实现FP8的效果,必须使用诸如BF16等更宽的数据类型,这就导致对硬件的要求更高,需要4台8卡一体机才能运行起来,一体机成本直接飙升到六七百万元。

“除非专业人士,大多数人对于性能本身没有很强的认知和理解力。”胡健同样表示,满血版一体机中,除了真正的原版模型,还存在量化版和蒸馏版,蒸馏版还可以分为32B、70B等。用千问模型和DeepSeek数据训练得到的蒸馏版也带有思维链,但智商比原版低。而将8比特变为4比特的量化版,其精度和性能同原版相比都有所下降,但强于蒸馏版。

一种过度需求

“现阶段,用户想尝鲜,企业想卖一体机,就可能存在鱼龙混杂。”胡健表示,模型版本、并发数、吞吐量都决定了DeepSeek一体机在企业内的适用程度。

并发数是影响DeepSeek一体机使用性能的关键因素。胡健介绍,一些价格10万元的满血版一体机只能做到一个并发,仅供单个用户使用,首字延迟时间也长,影响使用体验。一个100人左右的企业使用一体机检索企业内部知识库,至少要保证10个并发。满血版DeepSeek一体机的并发数在200以内,“如果输入特别长,并发会进一步降低。比如输入一个长文档,再加上一段很长的输入,并发数就会下降。”

行云集成电路创始人兼CEO季宇则告诉澎湃科技,并发数越多,用户体验感越差。例如1000个并发之下,单个用户每秒只能生成5个token,这样的高并发是无意义的,因为输入输出速度也影响实际体验。业界公认的临界输出速度是20 token/秒,这也是DeepSeek官网提供的体验。10 token/秒的输出速度较慢,6 token/秒易使人焦急等待输出。但输出速度慢,对硬件资源的要求就低。

多位业内人士对澎湃科技表示,当前DeepSeek一体机爆火甚至过热,但挑战在于持续维护升级,一体机的综合使用成本仍然高昂。一体机是一种过度需求,无法满足大规模使用,企业最终还是会上云。

胡健表示,一旦进入私有化环境,出于安全考虑,企业不会允许外部远程访问私有数据和系统进行迭代升级。对于销售企业而言,“卖一台几十万元的一体机,还要让人带硬盘飞过去安装升级,也不现实。”对于服务器级别的一体机而言,机房、电力、温度都要满足使用条件,这些改善成本分摊下来,使得一体机的“尝鲜价”并不低。

在胡健看来,当前大模型和业务场景结合仍处于试点阶段,DeepSeek一体机是一个过渡性产品。一台满血版DeepSeek一体机可支持100-200个并发,可支持线上问答应用场景,“一旦真正和业务场景结合,一台一体机的并发完全不够。这时候要么建私有化机房,要么利用公有云或混合云解决高并发、多场景的使用问题。”对于DeepSeek一体机市场的可持续性,胡健认为,这取决于大模型能力的持续提升以及与企业业务的结合程度,一旦与企业内部流程和应用打通,就会出现混合云或私有云模式。“如果打通速度快,那就转向上云,如果速度慢,一体机还会持续存在一段时间。”

“开箱即用”的条件

DeepSeek技术革新降低了AI大模型本地化部署的成本和门槛,促进了对于数据安全要求较高的央国企和金融类企业本地化部署DeepSeek等AI大模型。广发证券计算机首席分析师刘雪峰今年3月在研报中提到,随着DeepSeek本地化部署的广泛开展,算力一体机有望放量。预安装了DeepSeek大模型的算力一体机有望在各企业用户侧快速渗透。除了推出不同型号的机型,各家企业还搭载了用于模型微调、语料训练、应用开发的AI基础工具。

但CCF(中国计算机学会)数据发展委员会主任陆志鹏4月份表示,一些企业以为把DeepSeek模型部署到服务器上就是一体机,就可以“开箱即用”,结果客户采购后发现并没有达到说明书上的效果,反而引起法律纠纷。

胡健介绍,公文写作一体机、合同审核一体机等结合使用场景的DeepSeek一体机,其开箱即用的概率更高。对于脱离场景的一体机,开箱即用的是模型调用,但打通业务流程仍需接入和治理数据,整理数据库,二次开发或微调。

蔺文强建议企业要根据自身使用需求采购DeepSeek一体机,明确是追求极致的性能还是极致的性价比、是否有国产化需求、是否需要满血版的一体机,同时还要考虑服务调优的响应速度和支持方式,“采购一体机要考虑适不适合企业业务,如果不适合就需要调优,甚至需要二次训练。”

对于采购建议,新华三展台的工作人员表示,尽管当前一二三线厂商都在销售一体机,但缺乏安全能力。“如果要有安全能力,就得找其他厂家再买一个服务器做开发和对接。”该工作人员表示,DeepSeek一体机要考虑数据安全问题。例如一些集团公司旗下多个子公司之间数据隔离,这些子公司之间甚至存在竞争关系,集团公司利用不同子公司的数据进行训练就需要保证数据安全。与此同时,由于硬件成本和软件开发成本有差异,一些小厂家的一体机价格反而更高。采购一体机时还需要考虑厂家的技术能力,尤其是当出现漏洞时能否及时提供修复服务。此外要识别DeepSeek版本,不同版本精度不同。

4月底,行云集成电路推出10万元级的满血版一体机,“很多客户在五一期间跟我们对接,现在也有一些客户已经下单。”季宇说,目前一体机行业处于早期阶段,市场秩序的建立仍需时间。如果能够降低新鲜事物的成本,就可以降低试错成本,扩大体验覆盖面,让行业成长起来。“相对于上百万元的机器来讲, 10万元的价位已经便宜了很多,但实际上还是比较贵,我们希望能持续降低价格,让大家能够低成本体验大模型带来的价值。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
重磅!湖人新老板首签锁定26+20超级新星,紫金王朝再现曙光!

重磅!湖人新老板首签锁定26+20超级新星,紫金王朝再现曙光!

埃文凯尔
2025-06-21 01:13:22
吃霸王餐的钱总可能肠子都悔青了!生意被曝,新婚女儿也抬不起头

吃霸王餐的钱总可能肠子都悔青了!生意被曝,新婚女儿也抬不起头

云景侃记
2025-06-20 21:25:05
以色列国防军宣布解除伊朗中央总部司令阿里·沙德马尼少将的职务

以色列国防军宣布解除伊朗中央总部司令阿里·沙德马尼少将的职务

仗剑看世界
2025-06-17 16:35:41
以军总参谋长:伊朗拥有约2500枚地对地导弹,以色列必须做好打“持久战”准备

以军总参谋长:伊朗拥有约2500枚地对地导弹,以色列必须做好打“持久战”准备

政知新媒体
2025-06-21 07:27:51
93年上海女子用60万购入浦西一片荒地,15年后的市值,让她不敢相信

93年上海女子用60万购入浦西一片荒地,15年后的市值,让她不敢相信

星宇共鸣
2025-05-29 15:25:05
为何犹太能掌控美国,却拿中国没办法?多次下手都被我国识破反制

为何犹太能掌控美国,却拿中国没办法?多次下手都被我国识破反制

傲傲讲历史
2025-06-05 21:10:19
证监会重磅!股市,利好来了!

证监会重磅!股市,利好来了!

中国商界杂志社
2025-06-20 20:35:35
6 种你爱吃的食物,正在悄悄让你失眠(不是咖啡)

6 种你爱吃的食物,正在悄悄让你失眠(不是咖啡)

丁香生活研究所
2025-06-19 12:02:10
沙特国土面积240万,竟没有一条河,3500万人如何解决饮水问题

沙特国土面积240万,竟没有一条河,3500万人如何解决饮水问题

诗意世界
2025-06-20 21:50:39
34岁数学教授王虹受热捧,老家村民:她从小就很聪明,家里出了好几个老师

34岁数学教授王虹受热捧,老家村民:她从小就很聪明,家里出了好几个老师

极目新闻
2025-06-20 20:59:53
印度偷送中国导弹残骸给日本!专家拆开后傻眼:中国早埋了雷

印度偷送中国导弹残骸给日本!专家拆开后傻眼:中国早埋了雷

起喜电影
2025-05-29 09:15:17
伊朗能有今天,白左“功不可没”

伊朗能有今天,白左“功不可没”

难得君
2025-06-19 12:33:48
文章现状曝光:生活低调,40岁胖到快认不出,和新女友生活很甜蜜

文章现状曝光:生活低调,40岁胖到快认不出,和新女友生活很甜蜜

橘子大娱社
2025-05-16 19:40:03
2004年,任长霞因“车祸”殉职,在涉案司机身上却搜出了60万支票

2004年,任长霞因“车祸”殉职,在涉案司机身上却搜出了60万支票

坦然风云
2025-06-17 20:16:01
美媒:中国高校及学生正改变全球教育格局

美媒:中国高校及学生正改变全球教育格局

环球网资讯
2025-06-21 07:00:08
不许改变南海现状,G7再度对华叫板,话音刚落,中方直接定下规矩

不许改变南海现状,G7再度对华叫板,话音刚落,中方直接定下规矩

妙知
2025-06-20 10:31:09
6月21日起,养老金调整通知将迎来公布,挂钩百分比将低于1%吗?

6月21日起,养老金调整通知将迎来公布,挂钩百分比将低于1%吗?

小嵩
2025-06-21 09:23:43
胡塞武装、黎巴嫩真主党发声:将采取行动支持伊朗

胡塞武装、黎巴嫩真主党发声:将采取行动支持伊朗

红星新闻
2025-06-20 11:14:17
伊朗祭出一大杀器,泥石导弹已经改变战争格局,难怪哈梅内伊不怕

伊朗祭出一大杀器,泥石导弹已经改变战争格局,难怪哈梅内伊不怕

博览历史
2025-06-20 09:32:28
伊万卡13岁女儿穿妈妈7年前的旧衣出席活动,引热议

伊万卡13岁女儿穿妈妈7年前的旧衣出席活动,引热议

译言
2025-06-20 15:38:54
2025-06-21 10:56:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
809264文章数 5074601关注度
往期回顾 全部

科技要闻

Siri有救了?苹果被曝正讨论史上最大收购

头条要闻

为了拱火美政府动手打伊朗 美媒扯上了台湾

头条要闻

为了拱火美政府动手打伊朗 美媒扯上了台湾

体育要闻

周通:2年前想过退役,没想到能踢世俱杯

娱乐要闻

70岁寇振海跳舞,网友:和依萍抢饭碗

财经要闻

A股公司60亿买的“三文鱼”1元抛售

汽车要闻

五项订车礼/四款车型 一汽奥迪A5L正式开启预售

态度原创

家居
房产
旅游
艺术
健康

家居要闻

山水之间 墨染风雨云间

房产要闻

坑惨2000多人!恒大财富海南高管被曝非吸12.6亿元!

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

呼吸科专家破解呼吸道九大谣言!

无障碍浏览 进入关怀版