网易首页 > 网易号 > 正文 申请入驻

国际媒体发布研究报告:中国企业DeepSeek只从中国大陆招聘员工,其核心员工的年收入超过130万美元

0
分享至


散英魂寄千万雄鹰翱翔神州,

尽智魄载十亿慧芯呼唤华夏。

——《国务院给予江上舟同志挽联》

01

前沿导读

根据媒体 SemiAnalysis 的数据报告显示,中国ai企业DeepSeek 只从中国境内招聘,而不是从台湾或美国挖角。其招聘的目的是专注于技能和解决问题的能力,而不是正式的证书。

招聘工作以北京大学和浙江大学等提供极具竞争力的薪酬机构为目标。根据这项研究,DeepSeek 的一些 AI 研究人员的收入超过 130 万美元,超过了 Moonshot 等其他领先的中国 AI 公司的薪酬。


02

DeepSeek的投入

DeepSeek 在大模型训练上投入的成本仅为 600 万美元以及 2048 个 GPU,但该模型被认为是可以与 Open AI 的 o1 相媲美的存在。

DeepSeek一共推出了两款大模型,V3和R1。

V3采用混合专家(MoE)架构,拥有6710亿参数,但每次推理仅激活370亿参数,这种设计显著降低了计算成本。它使用了14.8万亿条标记进行训练,通过强化学习后训练,增强了推理能力,能够实现类似人类的“思路链”问题解决。

V3的训练成本仅为557万美元,远低于GPT-4o的1亿美元。其训练效率也非常高,仅用了278.8万GPU小时,在2048块Nvidia H800 GPU上用55天完成训练。


在多项基准测试中,DeepSeek-V3的表现接近甚至超越了Claude Sonnet和GPT-4o等国际顶尖模型。例如,在数学竞赛(如AIME 2024和MATH-500)和代码生成任务(如Codeforces)中,V3的表现尤为突出。

而R1大模型同样采用MoE架构,拥有6710亿参数,其中370亿参数处于活动状态以处理特定任务。它通过纯强化学习达到OpenAI o1的水平,成本却低95%。

其训练成本为550万美元,不到ChatGPT费用的十分之一。其训练过程与V3相差无几,都是278.8万GPU小时和2048块H800 GPU。


虽然DeepSeek将训练成本和训练所使用的芯片公布出来,但是国际行业分析公司 SemiAnalysis 发布了报告称,DeepSeek 背后的公司承担了 16 亿美元的硬件成本,并拥有 50000 个 Nvidia Hopper GPU 的队列,这一发现将会削弱 DeepSeek 以比 AI 行业领导者低得多的投资重塑 AI 训练和推理的想法。

DeepSeek 起源于中国对冲基金 High-Flyer,该企业很早就意识到 AI 在金融以外的领域有着深度的潜力和可以扩展的关键洞察力。因此,他们一直在不断采购英伟达的 GPU 产品。


在对具有数千个 GPU 集群的模型进行试验后,High Flyer 在 2021 年一共采购了 10000 个 A100 GPU,由于当时还没有任何对于ai芯片的出口限制,所以这些GPU芯片可以轻松的买到。

随着 High-Flyer 的改进,他们在 2023 年 5 月拆分出“DeepSeek”作为独立的ai公司运作,目标是更专注于追求更多的 AI 功能。


DeepSeek团队以前期5.78亿美元的研发投入为基础,将单个模型训练边际成本降至557万美元,仅为同类模型的30%。这种成本分摊策略降低了单个模型的训练成本,使得大规模模型训练更加经济。

在训练R1大模型时,DeepSeek在2048块H800 GPU集群上实现了98.7%的持续利用率,相较传统训练方案提升了20个百分点。这种负载均衡策略确保了硬件资源的充分利用,避免了资源闲置,最大化了生产效率。

尽管美国对向中国出口先进GPU的限制不断升级,但DeepSeek仍然通过合规渠道采购了大量英伟达芯片。

例如,DeepSeek训练其V3模型所使用的H800芯片,这些芯片是英伟达专为中国市场定制的版本,虽然性能相较于H100有所削弱,但仍能满足DeepSeek的训练需求。


H100是英伟达目前最强大的完全体AI芯片之一,基于Hopper架构,采用台积电N3制程技术。它集成了八个HBM3显存,提供高达900GB/s的内存带宽。

这些芯片主要用于高性能计算和AI训练任务,特别是在需要高内存带宽和高计算性能的场景中。例如,Meta在训练其Llama 3模型时使用了16384块H100 GPU。


而DeepSeek所采购的H800芯片,也是基于Hopper架构技术,但性能相较于H100有所削弱。H800的显存带宽缩减至约400GB/s。H800主要用于AI推理和训练任务,特别是在需要较高性能但又受限于出口管制的场景中。

03

扩张国产技术

DeepSeek采取“一年14薪”的模式,即每个自然年度发放14个月的薪水,这意味着员工每年可以额外获得两个月的工资。从薪资待遇上面来看,DeepSeek的基础保障要强于一般的企业。

而且DeepSeek主要在中国大陆招聘员工,其初创团队和投入资本均脱胎于幻方量化,这家公司在中国有着深厚的根基,在北京、杭州两地设有办公地点。

DeepSeek 定期在北京大学和浙江大学等顶尖大学举办招聘活动,许多员工都毕业于浙江大学。据权威媒体所称,DeepSeek将为有前途的候选人提供超过 130 万美元的薪水,这个收入远高于竞争激烈的中国大型科技公司以及像 Moonshot 这样的人工智能实验室。

人工智能是当下最具有红利期的领域,曾经布局多年的英伟达,凭借着CUDA技术生态,在人工智能时代站上顶峰。其公司的许多员工,都已经实现了身价超百万的收入水平。


根据Payscale和Blind的数据显示,2025年英伟达员工的平均薪资为142,087美元。中位数总薪酬为231,268美元,其中25th百分位的员工年薪为173,371美元,90th百分位的员工年薪为389,992美元。

2024年10月7日,英伟达创始人黄仁勋的个人净资产已达到1090亿美元。

2024年10月7日,英特尔的市值约为960亿美元。

黄仁勋一个人的资产,已经超过了世界500强企业英特尔的公司市值。这都是建立在人工智能大爆发下,所出现的戏剧性一幕。


DeepSeek现在专注于招募中国本土人才,不过分看重候选人的过往履历,而是更注重其实际能力和求知欲望。公司经常在北京大学、浙江大学等国内的顶尖高校举办招聘活动,许多公司的员工均毕业于这些院校。

对于较为重要的核心岗位,DeepSeek尤其看重应聘者的“学术”和“研究能力”,例如“深度学习研究员”岗位,对于在国际顶会或期刊发表相关论文的应聘者会优先招聘。

而且DeepSeek对校招和应届生非常友好,有很多岗位都在向学生群体开放,甚至有些岗位面向“在校生”。

公司认为年轻人更具创新能力和学习能力,能够为公司带来新的视角和活力。并且DeepSeek认为,如果追求短期目标,找现成有经验的人是对的,但如果看长远,经验就没那么重要。

往期经典回顾:20万+阅读量

往期经典回顾:40万+阅读量

往期经典回顾:100万+阅读量

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
成都男子180秒内没选出车牌,系统随机匹配914,男子认为914谐音“就要死”,要求重选被拒,起诉至法院

成都男子180秒内没选出车牌,系统随机匹配914,男子认为914谐音“就要死”,要求重选被拒,起诉至法院

谭老师地理工作室
2025-03-27 17:30:47
网传某高校组织学生,对某博主进行集体举报,并要求上交举报截图

网传某高校组织学生,对某博主进行集体举报,并要求上交举报截图

小萝卜丝
2025-03-27 17:06:09
44岁女子腹腔包块,被按肿瘤切除生育器官:“我没生育过,现在啥都没了!”妇幼保健院认为不存在手术错误

44岁女子腹腔包块,被按肿瘤切除生育器官:“我没生育过,现在啥都没了!”妇幼保健院认为不存在手术错误

大风新闻
2025-03-27 17:15:07
交公粮的手拿不到退休金:中国农民养老困局刺痛14亿人的良心

交公粮的手拿不到退休金:中国农民养老困局刺痛14亿人的良心

小胖聊农
2025-03-26 09:44:14
浙江“亏损王”,巨亏71亿,套现70亿,给家乡捐2亿

浙江“亏损王”,巨亏71亿,套现70亿,给家乡捐2亿

沧海一书客
2025-03-27 15:28:51
这就是年轻人不交社保,养老金的原因

这就是年轻人不交社保,养老金的原因

东洲清
2025-03-27 10:49:07
亚航飞深圳客机紧急返航,吉隆坡起飞2小时后折返,乘客:极度煎熬,有人默默流泪

亚航飞深圳客机紧急返航,吉隆坡起飞2小时后折返,乘客:极度煎熬,有人默默流泪

界面新闻
2025-03-27 17:32:40
倒数第7天,李嘉诚彻底出局,中方找上黑石集团,190亿或打水漂

倒数第7天,李嘉诚彻底出局,中方找上黑石集团,190亿或打水漂

国际阿尝
2025-03-27 12:04:17
“一丝不挂”新舞蹈?惹争议,被摸下体更不害臊,金星质疑是对的

“一丝不挂”新舞蹈?惹争议,被摸下体更不害臊,金星质疑是对的

吃鱼思故渊
2024-05-16 21:48:21
一夜变天!中国突然向全球宣布:不许再帮台湾一下!释放信息量大

一夜变天!中国突然向全球宣布:不许再帮台湾一下!释放信息量大

蓝泾看一看
2025-03-27 09:15:58
欧盟:希望所有公民都配备满足72小时需求的物资

欧盟:希望所有公民都配备满足72小时需求的物资

参考消息
2025-03-27 10:33:08
谷歌决定终止开源Android

谷歌决定终止开源Android

第一财经资讯
2025-03-27 15:23:26
温州一负债人离世!当地公示其欠下300余万,网友:人走了能咋办

温州一负债人离世!当地公示其欠下300余万,网友:人走了能咋办

明月杂谈
2025-03-27 19:52:03
震惊印度的实习女医生被残忍奸杀案,又爆出新内幕!案件复杂性升级!

震惊印度的实习女医生被残忍奸杀案,又爆出新内幕!案件复杂性升级!

新民周刊
2025-03-27 18:56:44
曾任“湄公河惨案”专案组组长的刘跃进受审:被控受贿1.21亿余元,受贿时间跨度近30年

曾任“湄公河惨案”专案组组长的刘跃进受审:被控受贿1.21亿余元,受贿时间跨度近30年

红星新闻
2025-03-27 18:54:37
后劲不足,DeepSeek排名突然下滑,跌出前三,三大问题成发展瓶颈

后劲不足,DeepSeek排名突然下滑,跌出前三,三大问题成发展瓶颈

凡知
2025-03-26 17:04:24
网传某公司要求员工签"自愿加班申请书::本人知晓用工法律规定,但自愿放弃休假

网传某公司要求员工签"自愿加班申请书::本人知晓用工法律规定,但自愿放弃休假

可达鸭面面观
2025-03-27 14:48:12
报应来了!高铁光脚男打完人跑了,却被客户认出来:终止一切合作

报应来了!高铁光脚男打完人跑了,却被客户认出来:终止一切合作

鋭娱之乐
2025-03-27 18:45:57
亚航飞深圳航班返航,回应称发动机出故障但没起火!乘客发声

亚航飞深圳航班返航,回应称发动机出故障但没起火!乘客发声

南方都市报
2025-03-27 17:51:07
AI进化的程度太恐怖了!名场面都被生成大师级漫画,学美术的人通通要失业

AI进化的程度太恐怖了!名场面都被生成大师级漫画,学美术的人通通要失业

小萝卜丝
2025-03-27 14:18:19
2025-03-28 03:47:00
逍遥漠 incentive-icons
逍遥漠
主攻数码、科技领域原创图文
158文章数 262关注度
往期回顾 全部

财经要闻

地王潮再起!

头条要闻

印度女医生被奸杀体内精液达150毫升 更多新内幕被扒

头条要闻

印度女医生被奸杀体内精液达150毫升 更多新内幕被扒

体育要闻

勒布朗,第八个压秒绝杀

娱乐要闻

首次曝光!金赛纶轻生前聊天曝光!

科技要闻

蔚来突发!要融资超30亿元

汽车要闻

搭乾崑智驾 阿维塔06预售21.59万元起

态度原创

房产
家居
数码
时尚
军事航空

房产要闻

重磅利好!海南中学正式签约,江东又要开挂了!

家居要闻

大气轻奢 尽显设计巧思

数码要闻

DJI大疆天空之城10周年影像大赛获奖作品公布

这个风格太减龄了!可以从20岁穿到70岁

军事要闻

4名美军士兵失踪 距白俄边境不到10公里

无障碍浏览 进入关怀版