网易首页 > 网易号 > 正文 申请入驻

英伟达4亿美元收购95后华人青年AI创业公司,为提高GPU利用率再增“新砝码”

0
分享至

前脚 AMD 刚刚收购加拿大 AI 初创公司 ,后脚英伟达就斥资 4 亿美元收购了一家华人 95 后和导师联合创办的加拿大 AI 初创公司CentML[1]。这位青年名叫王尚,此前担任 CentML 的联合创始人兼 CTO据了解,王尚出生于山东省青岛市,高中就读于青岛二中。2018 年其本科毕业于加拿大多伦多大学,后又在该校先后获得硕士学位和博士学位。他的硕博导师都是多伦多大学的根纳季·佩基门科(Gennady Pekhimenko)教授,而佩基门科教授本人则是 CentML 的联合创始人兼 CEO。值得注意的是,更早之前王尚还在谷歌、英特尔和华为加拿大分公司实习过。

图 | 王尚(来源:http://www.cs.toronto.edu/~wangsh46/)

在收购 CentML 之前,英伟达击败了竞标者并成为最终赢家。据介绍,CentML 开发的软件能在 AI 模型和芯片之间运行,从而利用尚未得到充分利用的硬件容量,并能采用其他技巧使系统运行得更好。CentML 通过出售软件的订阅服务来盈利,其还与云服务提供商签订了收入分成协议,进而将其技术捆绑到服务方案中,旨在帮助客户确定到底使用哪些硬件可以提高机器学习模型的性能并降低其成本,进而帮助客户从现有硬件中获得更多价值。

图 | CentML 公司官网(来源:https://centml.ai/)

据了解, CentML 于 2025 年 6 月 6 日终止了其加拿大联邦商业注册。一封发给 CentML 客户的电子邮件被曝光在社交媒体上,邮件显示 CentML 的运营将于 2025 年 7 月 17 日正式结束。与此同时,该公司更新了它的注册信息、董事以及通信地址。新列出的董事是三名英伟达高管,其通信地址为英伟达位于美国加利福尼亚的总部。

事实上,这次收购可谓谋划已久。英伟达首次涉足 CentML 是在 2023 年 10 月,当时它为 CentML 提供了一笔 2700 万美元的种子轮融资。该轮融资由谷歌旗下专注于 AI 的 Gradient Ventures 基金领投,德勤创投、汤森路透创投和 Radical Ventures 等知名风投公司跟投。当时,这笔资金曾用于在 2024 年底前将 CentML 的 32 人团队扩大一倍。

据一位消息人士告诉外媒,CentML 的出售对其投资者和股东而言价值远超 3 亿美元。但另一位消息人士表示,考虑到包括以“达到业绩目标为条件的承诺”在内的因素,该交易的总价值可能升至 4 亿美元以上,因此这笔交易可能会为 CentML 的早期投资者带来丰厚回报。

图 | CentML 的四位联合创始人。从左到右分别是:联合创始人兼首席架构师阿南德·贾亚拉詹(Anand Jayarajan)、联合创始人兼 COO 阿克巴·努尔利巴耶夫(Akbar Nurlybayev)、联合创始人兼 CEO 根纳季·佩基门科(Gennady Pekhimenko)、联合创始人兼 CTO 王尚(来源:资料图)

其实,王尚和英伟达的渊源颇深。在联合创办 CentML 之前,他曾在英伟达担任工程师,主要工作任务是帮助优化训练工作负载以便提高 GPU 性能,也就是说他第一次在英伟达负责的工作内容和后来所创立的 CentML 的业务内容大致类似。2022 年,他参与创办了 CentML,并由自己的导师佩基门科担任 CEO。佩基门科目前仍在加拿大多伦多大学担任副教授一职,并指导着将近 20 名学生。在 CentML 的四名主要创始成员中,除了佩基门科之外,其余三位创始成员中有两名都是自己的学生,而其中一名便是王尚。那么,他为何选择王尚一起创办了 CentML?王尚有着怎样的技术成果?关于此,从王尚的两篇代表论文或许可以窥斑见豹。这两篇论文分别于 2020 年和 2021 年发表在机器学习与系统会议(MLSys,Machine Learning and Systems)上。手握至少两篇顶会一作论文以及成果具有较高的应用性,可能是自己得以和导师共同创业的原因。那么,这两篇论文分别讲了什么?

图| 在两篇论文中所展示的王尚当时的照片(来源:http://www.cs.toronto.edu/~wangsh46/)

在 2020 年的一作论文中,王尚和同事旨在提高反向传播的可扩展性,为此他和同事将反向传播重新表述为一种扫描操作。扫描操作是一种原语,它按顺序对一系列值进行聚合,并返回每一步的中间结果。然后,通过改进之后的布莱洛克扫描算法(Blelloch scan algorithm),在并行系统上扩展这种反向传播的重新表述形式。研究中,他们使用合成数据集针对基础循环神经网络进行了训练评估,并使用 IRMAS 数据集针对带有门控循环单元的循环神经网络进行了训练评估,结果显示这一方法在整体训练时间上实现了高达 2.75 倍的速度提升,在反向传播上实现了 108 倍的速度提升,并证明针对剪枝后的网络进行重新训练可以作为这一方法的实际应用场景。

图| 将反向传播重新表述为一种扫描操作的相关论文(来源:http://www.cs.toronto.edu/~wangsh46/)

在 2021 年的一作论文中,王尚等人分析了来自顶尖研究机构的 GPU 集群使用统计数据,以深入了解典型深度学习训练任务所实现的硬件效率。这一研究表明,当单加速器训练任务被重复启动时,例如当用于超参数调优时,它们可能会在集群范围内的资源消耗中占据主导地位,同时却在很大程度上并未充分利用硬件。研究中,王尚等人观察到这类工作负载具有以下独特特征:一是工作中的模型通常具有相同类型和形状的算子,二是这类算子的模型间水平融合等同于其他已经过良好优化的算子。因此,为了帮助业内人士有效提高深度学习训练工作负载的硬件利用率,王尚等人在这项研究中提出了水平融合训练阵列(HFTA,Horizontally Fused Training Array)。HFTA 是一个深度学习框架扩展库,它能够横向融合来自不同重复性任务的模型,直至算子级别,然后在共享加速器上实现同步训练。研究中,王尚等人将 HFTA 用于在当时最新 GPU 和 TPU 上训练的六个深度学习模型。结果表明,与在单独的加速器上运行每个作业的标准做法相比,HFTA 在提高硬件利用率方面非常有效,其训练吞吐量可提高高达 15.1 倍。

图 | HFTA 的相关论文(来源:http://www.cs.toronto.edu/~wangsh46/)

由此可见,王尚在五年前就开始关注大模型,并在提高 GPU 利用率上做出了一定成果。而在 2025 年 5 月,也就是 CentML 被英伟达收购的不久之前,王尚接受一家外媒采访并介绍了 CentML 的业务进展。

在上述采访中,王尚表示 CentML 的开源机器学习编译器 Hidet 可以直接对接该公司基于 vLLM 的服务引擎 CServe,进而与 CentML 的一体化 AI 基础设施方案实现顺畅集成。借助 CentML 平台,开发者能够选择 Llama、Mistral 或 DeepSeek 等任何开源模型,并将其部署在任何硬件上(从英伟达 H100、AMD MI300X 到 TPU 均可),后续的性能优化和部署工作则由该技术栈自动完成。王尚表示,通过 CentML 平台,他和同事对于经 AWQ 量化的 DeepSeek-R1 模型进行了优化和部署。在 GPU 内核层面,CentML 借助 Hidet 编译器的领域特定语言 Hexcute,为 DeepSeek -R1 的关键组成部分——混合专家层构建了一个全融合 GPU 内核。相比基于 Triton 编译器打造的同类最佳方案,这一做法将 MoE 层的速度提升了 2 到 11 倍。此外,在推理引擎层面,CentML 构建了 EAGLE 推测式解码技术,该技术利用一个更小的草稿模型来减少原始大模型的工作量并助力其实现并行化,从而能够实现 1.5 到 2 倍的速度提升。

同样是在上述采访中,王尚还介绍了 CentML 团队发表在 2025 年机器学习与系统会议的一篇论文。该论文介绍了一款名为 Seesaw 的大模型推理引擎,其专门针对吞吐量导向型任务优化打造而来。Seesaw 的核心思想是动态模型重分片,该技术能够促进不同阶段间并行化策略的动态重构,从而在两个阶段均实现吞吐量最大化。为了减轻重分片开销以及优化计算效率,CentML 团队采用了分层 KV 缓存缓冲和过渡最小化调度的方法。这些方法通过协同作用能够减少因频繁的阶段转换所带来的开销,同时还能确保批处理效率的最大化。评估结果表明,与目前应用最广泛的顶尖大模型推理引擎 vLLM 相比,Seesaw 的吞吐量最高提升 1.78 倍(平均提升 1.36 倍)。

图 | Seesaw 的相关论文(来源:https://arxiv.org/pdf/2503.06433)

而此次 CentML 被英伟达收购以后,包含王尚在内的几位 CentML 创始人均已入职英伟达。原 CEO 佩基门科目前在英伟达担任 AI 软件高级总监,同时仍在多伦多大学担任教职;作为原 CTO 的王尚目前在英伟达担任 AI 软件系统经理;原首席架构师阿南德·贾亚拉詹(Anand Jayarajan)目前在英伟达担任工程经理;原 COO 阿克巴·努尔利巴耶夫(Akbar Nurlybayev)目前在英伟达担任 AI 软件高级经理。综合媒体报道和职业网站信息,英伟达此次还从 CentML 收编了十几名技术人员。总的来说,等待王尚等人的将是一个新的职业生涯。

参考资料:

1、https://thelogic.co/news/exclusive/nvidias-deal-centml-us400m/

http://www.cs.toronto.edu/~wangsh46/

https://thelogic.co/news/exclusive/centml-nvidia-acquisition-canada-ai/

https://www.theglobeandmail.com/business/article-nvidia-acquires-canadian-machine-learning-company-centml/

https://arxiv.org/abs/2402.16731

https://arxiv.org/abs/2102.02344

https://arxiv.org/abs/1907.10134

https://www.linkedin.com/in/anandj91/

https://www.linkedin.com/in/gpekhimenko/

https://www.linkedin.com/in/akbarnurlybayev/?originalSubdomain=ca

https://www.linkedin.com/in/shang-sam-wang-52851489/

https://centml.ai/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
奉劝男性:若不想被前列腺炎折磨下半生,尽早改掉这4大习惯!

奉劝男性:若不想被前列腺炎折磨下半生,尽早改掉这4大习惯!

全球军事记
2026-03-02 10:13:18
中俄边境传来了好消息,俄罗斯终于是想通了,废弃25年的铁路重新开通

中俄边境传来了好消息,俄罗斯终于是想通了,废弃25年的铁路重新开通

王姐懒人家常菜
2026-03-08 01:53:07
亚马尔极限破门!巴萨1:0险胜毕巴,2大主力悍将:遭疯狂吐槽

亚马尔极限破门!巴萨1:0险胜毕巴,2大主力悍将:遭疯狂吐槽

话体坛
2026-03-08 06:42:40
欠中国的钱,委内瑞拉不还了?美财长:中国已无法继续获得委石油

欠中国的钱,委内瑞拉不还了?美财长:中国已无法继续获得委石油

萌城少年强
2026-01-22 12:47:40
原来我们熟悉的许多明星用的都是艺名,谁的本名最令你感到意外?

原来我们熟悉的许多明星用的都是艺名,谁的本名最令你感到意外?

上官晚安
2026-02-08 01:36:41
出轨、净身出户?这次,74岁的梁锦松,终究在伏明霞身上栽了跟头

出轨、净身出户?这次,74岁的梁锦松,终究在伏明霞身上栽了跟头

秋姐居
2026-02-10 09:19:42
美军B2轰炸机来了,伊朗外长致电王毅,提一个请求,中方斩钉截铁

美军B2轰炸机来了,伊朗外长致电王毅,提一个请求,中方斩钉截铁

面包夹知识
2026-03-06 14:15:50
男子养豪猪拔刺 每斤刺能卖400元

男子养豪猪拔刺 每斤刺能卖400元

闪电新闻
2026-03-08 00:25:56
伊能静春晚封神!儿子哈利急返台北陪庾澄庆,进门喊爸反应真实,秦昊举动成谜

伊能静春晚封神!儿子哈利急返台北陪庾澄庆,进门喊爸反应真实,秦昊举动成谜

情感大头说说
2026-03-07 17:04:14
难辨真伪,但确实有可能,美媒:中国用歼16的旧雷达来升级歼11B

难辨真伪,但确实有可能,美媒:中国用歼16的旧雷达来升级歼11B

啸鹰评
2026-03-07 23:24:42
后续!母子睡楼道132天:数名男子轮番守房,儿子大冬天睡帐篷

后续!母子睡楼道132天:数名男子轮番守房,儿子大冬天睡帐篷

离离言几许
2026-03-07 10:04:12
谷爱凌参加罗浮宫晚宴,终于像亚洲人!不刻意扮外国人,好看多了

谷爱凌参加罗浮宫晚宴,终于像亚洲人!不刻意扮外国人,好看多了

乡野小珥
2026-03-08 07:48:49
股价低至6元化工龙头,2家社保联手新进,横盘222天,4大风险

股价低至6元化工龙头,2家社保联手新进,横盘222天,4大风险

风风顺
2026-03-08 03:00:03
戏子当道,是央国企管理中的一大痛点

戏子当道,是央国企管理中的一大痛点

细说职场
2026-03-06 20:01:27
“哈梅内伊之死”可以有几种赢法?

“哈梅内伊之死”可以有几种赢法?

名人苟或
2026-03-07 06:04:59
伊朗12小时内向以色列发射6轮导弹

伊朗12小时内向以色列发射6轮导弹

界面新闻
2026-03-07 20:09:58
老年人的性生活多久一次合理?要戴套吗?答案颠覆认知

老年人的性生活多久一次合理?要戴套吗?答案颠覆认知

贱议你读史
2026-03-06 23:28:50
不是取消!私家车年检迎来史上最大松绑,车主:这才是真便民

不是取消!私家车年检迎来史上最大松绑,车主:这才是真便民

芭比衣橱
2026-03-06 14:06:42
伊朗与王毅通话后,中俄领衔27国集体发声必保全伊朗

伊朗与王毅通话后,中俄领衔27国集体发声必保全伊朗

命运自认幽默
2026-03-07 04:24:25
大降价!温州知名酒店卖了一个亿

大降价!温州知名酒店卖了一个亿

温百君
2026-03-05 18:52:20
2026-03-08 10:31:00
算法与数学之美 incentive-icons
算法与数学之美
分享知识,交流思想
5399文章数 64616关注度
往期回顾 全部

财经要闻

油价要失控?

头条要闻

媒体:伊朗问题要注意普京的动向 其在向美以喊话

头条要闻

媒体:伊朗问题要注意普京的动向 其在向美以喊话

体育要闻

塔图姆298天走完这段路 只用27分钟征服这座城

娱乐要闻

汪小菲曝亲妈猛料,张兰公开财产分配

科技要闻

OpenClaw最大的推手是闲鱼和小红书

汽车要闻

逃离ICU,上汽通用“止血”企稳

态度原创

教育
时尚
旅游
健康
家居

教育要闻

成长路上的心灵迷雾:青春期女生常见心理

2026春夏一定要拥有的6只包,好看又百搭

旅游要闻

湖州,不只有风景

转头就晕的耳石症,能开车上班吗?

家居要闻

暖棕撞色 轻法奶油风

无障碍浏览 进入关怀版