网易首页 > 网易号 > 正文 申请入驻

晚点独家丨袁进辉新公司获创新工场、王慧文等 5000 万投资

0
分享至

“第一次创业打出了技术影响力,这一次想证明好的技术能赚钱。”

文丨贺乾明
编辑丨程曼祺

OneFlow 创始人、光年之外联合创始人袁进辉近期宣布再次创业,成立新公司硅基流动(SiliconFlow)。

《晚点 LatePost 》独家获悉,硅基流动已完成 5000 万元人民币天使轮融资,由创新工场领投,耀途资本、奇绩创坛、美团联合创始人王慧文等跟投,投后估值为数亿元人民币。

袁进辉告诉《晚点 LatePost》,他和 OneFlow 核心团队从 2023 年 8 月开始筹备再次创业,新公司延续 OneFlow 的方向,做 AI Infra(AI 基础设施)层中的 “框架”。

AI 框架介于算力层和模型层之间,是一种系统软件,就像电脑操作系统能使普通用户直接用鼠标和键盘操作应用,AI 框架能帮开发者简单方便地设计模型或使用模型,而无需操心底层算力资源的调配。

不同的是,OneFlow 当年以通用训练框架为主,服务深度模型的生产;硅基流动则专注做推理框架,服务大模型的应用。

袁进辉认为,服务大模型应用比服务大模型生产更容易做出标准化产品,市场空间也大得多:模型生产是阶段性的,且由少数公司主导;大模型应用则会遍布各行各业、无处不在,被各种行业和规模的企业需要。

从 OneFlow 到 SiliconFlow,从训练到推理

袁进辉本科毕业于西安电子科技大学,2003 年考入清华大学计算机系,师从张钹院士攻读博士学位,做过机器学习、深度学习和脑科学的跨学科研究。

在 2013 年加入微软亚研院后,袁进辉做出了当时最快的主题模型训练算法和系统 LightLDA,之后又开始尝试研发 AI 训练框架,这也是 2017 年他创办的 OneFlow 的主攻方向。

当时市场上已有 Google 的 TensorFlow 和 Meta 的 PyTorch 等开源框架。袁进辉之所以觉得有创业机会,在于他有一个非主流的认知:未来 AI 模型会很大。

他的判断来自博士后阶段研究交叉学科的经历:人类大脑中有上千亿神经元,而当时最庞大的神经网络的参数(类似神经元)也没有破亿,大部分训练框架能满足当时模型的规模,却没有为巨大的模型优化。

袁进辉称,从 OneFlow 创业之初,他们就在开发大参数模型的训练框架,使用了现在大模型框架常用的分布式并行训练方法,这能提升用大量 GPU 同时训练单个模型的效率。

2022 年 11 月,PyTorch 发布分布式计算扩展程序 DistributedTensor 时,PyTorch 联合创始人苏米特·金塔拉(Soumith Chintala)还在社交平台上提到,部分灵感来自 OneFlow 的类似功能。

一位 AI 从业者曾告诉《晚点 LatePost》,OneFlow 训练大模型确实更方便,一般科技大公司使用的框架会在 Pytorch 或 TensorFlow 上又做一层封装和优化,但这些优化是面向信息推荐等已有业务定制的,不是针对大模型,“数亿参数和数百亿甚至上千亿参数的模型,训练框架要做的事差别很大”,OneFlow 则针对大模型训练做了优化。

2023 年初,大模型在全球获得广泛关注,OneFlow 的技术设想得到验证。同年 3 月,OneFlow 被光年之外并购,又 3 个月后,光年之外创始人王慧文因病退出创业,光年之外被美团收购,袁进辉选择再次创业。

“加入光年之外时是 40 人,再创业时有 35 人。” 袁进辉说,经过 2023 年的两次变动,OneFlow 核心团队仅有少数人员离开,关键原因是做推理系统的新方向让团队觉得有希望、有机会。

英伟达、亚马逊都在做推理框架,对手不乏大公司

推理框架的机会首先在于需求多、市场大。多位大模型从业者估算,如果大模型被广泛使用,大模型的训练和推理用量会达到 2:8,甚至 1:9。

这同时是一个客户相对分散的市场,供应商更有话语权,能自己生产大模型的公司是少数,基于模型开发应用或直接使用大模型的公司则多得多,它们都需要推理的优化。

推理成本偏高也正是当前的行业痛点,客户更愿意为此付费。传统软件一次开发、无限复制,边际成本显著降低;而用户每次调用大模型时都要消耗不少 GPU 计算资源做推理。这就是为什么付费版的 ChatGPT 也会限制用户使用 GPT-4 的次数,3 小时内最多用 50 次。

推理比训练有更大的成本优化空间。“用大量芯片训练大模型,硬件利用率的理论上限是 60% 多,英伟达同时做软硬件可以做到 50% 多,其它公司在这个基础上再优化,最多也只有约十个点的 margin;而推理环节还有数倍、甚至十倍的降本空间,推理的市场容量是训练的好多好多倍。” 袁进辉说。

袁进辉同时提到,做推理框架的资源门槛更低,对创业公司更友好。因为要做好大模型训练需要数千张 GPU 做实验平台,推理框架则可以使用规模小得多的算力资源做开发和优化。推理的需求也比较同质化,更容易做成标准产品,创业公司能集中精力做研发,减少定制化交付。

更大的市场机会、更低的资源门槛,意味着更多竞争对手,大小公司皆有:

- 大型云计算公司会开发类似产品与 AI 计算资源绑定销售,如亚马逊云的 SageMaker 和阿里云的 PAI 等;

- 芯片公司也会研发与芯片搭配的推理框架,如英伟达的 TensorRT-LLM;

- 创业公司方面则有贾扬清(知名 AI 训练框架 Caffe 的作者之一)创办的 Lepton AI,陈天奇(机器学习算法 XGBoost、深度学习编译器 TVM 作者)参与创办的 OctoAI,新加坡国立大学教授尤洋创办的潞晨科技,清华电子系主任汪玉创立的无问芯穹等;

- 学术界也有开源推理框架,如伯克利大学开发的 vLLM 等。

袁进辉并不担心硅基流动在这个领域的技术实力,他称公司的框架全部自研,并不基于英伟达的 TensorRT-LLM 或伯克利的 vLLM,这是目前最主流的两个推理框架。

据硅基流动展示,使用 8 块 A800 GPU 推理 700 亿参数的 Llama2,其语言大模型推理加速引擎 SiliconLLM 在吞吐、时延等指标上超过 vLLM、TensorRT-LLM,部分指标最高可达竞对产品的 10 倍。

袁进辉称,硅基流动拥有大量长期做 AI 框架的一线技术与工程人才,其中不少人是去了大公司相关团队又回来:“在业务庞大的大公司,AI 框架的优先级不见得很高,而对我们来说,这就是唯一。”

“第一次创业有了技术影响力,这次想证明好的技术能赚钱”

从 2017 年创业到 2023 年被收购,OneFlow 没让投资人亏钱,但也没能像国外同行那样独立盈利、快速增长,商业化谈不上成功。

OneFlow 的境遇不是个例,2016 年之后,中国出现一批基础软件创业公司,它们多尝试开源模式,发展初期有不错的融资,但多数越走越疲惫,鲜有跑出来的成功者。

这次创业前,袁进辉还是想着做一家面向企业客户的基础软件公司,他请教了创业成功的朋友,得到的反馈是悲观的:“我没想清楚为什么中国那么多优秀人才进入这个行业都做不好,也没看到你在这方面有超出常人的商业认知。”

对一家想做标准化技术 SaaS(软件即服务)的中国公司到底怎么走通商业化,袁进辉觉得现在他想得更清楚了。

决定创业时,他第一个想法就是积极开拓海外市场。袁进辉认为,海外、尤其是美国市场数字化程度较高,企业和开发者已经养成了软件付费习惯,培育出了 Databricks、Snowflake 等数百亿美元市值的公司,商业化难度较低,目前硅基流动已经谈下海外客户。

而在中国市场,他的策略是:绑定一个客户必须付费的产品,如硬件或云计算资源,一起卖软件。

带着 OneFlow 时期积累的经验和教训,袁进辉说,硅基流动有信心摸索出一条符合大环境的商业化路径。

在当前的融资环境下,留给硅基流动证明商业化能力的时间更紧迫了。

一位该领域创业者说,风投机构投资这类基础软件公司时,会因为创业团队的技术提供天使轮资金,但后续投资会更看重实际营收与客户,出手会越来越谨慎。

硅基流动的办公室在中国大模型和 AI 公司聚集地清华科技园。去年有一天,袁进辉去清华科技园楼下喜家德吃饺子,刚坐下就听到邻桌议论:“OneFlow 技术做得挺好 ...... 最后还不是没挣到钱,被收购。”

“有时我会想,我们是不是做了一个不好的范例?技术判断没问题,也勤勤恳恳做事,但还是无法取得大家认可的成功。” 袁进辉说,这次决定再创业,不想让团队四散分开,也是想努力证明和实现他觉得简单、正确的道理:“好的技术能赚钱。”

题图来源:《阿甘正传》

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
为什么饭后不能立即洗碗?提醒:3个科学道理,避免低级错误

为什么饭后不能立即洗碗?提醒:3个科学道理,避免低级错误

芹姐说生活
2026-05-08 12:32:51
国乒幕后功臣浮出水面!能战胜韩国有原因,王皓躲过一劫太幸运

国乒幕后功臣浮出水面!能战胜韩国有原因,王皓躲过一劫太幸运

三十年莱斯特城球迷
2026-05-08 22:57:55
4月吉利逆市扛旗,高质量增长跑出行业韧性

4月吉利逆市扛旗,高质量增长跑出行业韧性

汽车公社
2026-05-06 20:16:34
“4只皮皮虾1035元”店主离世、店铺停业,后续进展→

“4只皮皮虾1035元”店主离世、店铺停业,后续进展→

蓬勃新闻
2026-05-09 11:14:30
不尊重人!罗马尼亚女队击败法国,集体跳上球桌庆祝,结局没想到

不尊重人!罗马尼亚女队击败法国,集体跳上球桌庆祝,结局没想到

梅亭谈
2026-05-09 12:23:06
世乒赛半决赛将战法国!中国男团有几成把握?CCTV5全程直播!

世乒赛半决赛将战法国!中国男团有几成把握?CCTV5全程直播!

好乒乓
2026-05-09 11:31:23
香港富豪孙女被绑架,绑匪拿到2800万后逃跑,警方最新透露:女事主镇定、有条理,一个线索成破案关键

香港富豪孙女被绑架,绑匪拿到2800万后逃跑,警方最新透露:女事主镇定、有条理,一个线索成破案关键

南方都市报
2026-05-09 15:00:26
离谱!享界座椅被指夹人,多名车主拿自己孩子当实验品,有孩子一脸痛苦

离谱!享界座椅被指夹人,多名车主拿自己孩子当实验品,有孩子一脸痛苦

可达鸭面面观
2026-05-08 18:42:02
特朗普“密友”,访华了

特朗普“密友”,访华了

中国新闻周刊
2026-05-09 07:29:04
人民日报发声:机关事业单位的隐性收入,正在消失

人民日报发声:机关事业单位的隐性收入,正在消失

细说职场
2026-05-09 12:16:27
形势有多严峻?曾经的王牌专业凉了!辅导员和教授感到无力和沉重

形势有多严峻?曾经的王牌专业凉了!辅导员和教授感到无力和沉重

慧翔百科
2026-05-09 11:34:26
比亚迪:网传“比亚迪被约谈、立案”不实

比亚迪:网传“比亚迪被约谈、立案”不实

界面新闻
2026-05-09 12:58:38
泽连斯基声称“授权批准”俄方举行胜利日阅兵,俄方回应:不需要任何人批准

泽连斯基声称“授权批准”俄方举行胜利日阅兵,俄方回应:不需要任何人批准

环球网资讯
2026-05-09 14:36:09
原广州军区副司令员兼南海舰队司令员王永国逝世,享年87岁

原广州军区副司令员兼南海舰队司令员王永国逝世,享年87岁

澎湃新闻
2026-05-09 12:08:29
文班39+15+5帽创7纪录:神迹历史首人 被华子拉拽球衣也拦不住

文班39+15+5帽创7纪录:神迹历史首人 被华子拉拽球衣也拦不住

醉卧浮生
2026-05-09 12:33:41
杀人诛心!泽连斯基签法令“允许”红场阅兵,并附上精准GPS!

杀人诛心!泽连斯基签法令“允许”红场阅兵,并附上精准GPS!

老马拉车莫少装
2026-05-09 08:02:47
重磅!多名中国两院院士被除名或带走调查!

重磅!多名中国两院院士被除名或带走调查!

深度报
2026-05-08 22:40:42
海参崴的街头,谁在出卖我们的历史尊严?

海参崴的街头,谁在出卖我们的历史尊严?

迷世书童H9527
2026-05-07 14:55:09
白嫖榴莲女多重身份曝光!比大家想象中的还龌龊,难怪敢威胁商家

白嫖榴莲女多重身份曝光!比大家想象中的还龌龊,难怪敢威胁商家

夜深爱杂谈
2026-05-09 11:03:44
山东29岁美女王冰冰去世,确诊前月经不调,未婚未育办1个人婚礼

山东29岁美女王冰冰去世,确诊前月经不调,未婚未育办1个人婚礼

180视角
2026-05-09 07:54:07
2026-05-09 15:24:49
晚点LatePost
晚点LatePost
晚一点,好一点。商业的真相总是在晚点。《晚点LatePost》官方账号
3195文章数 21929关注度
往期回顾 全部

财经要闻

Meta疯狂拥抱人工智能:员工苦不堪言

头条要闻

恒大原总裁夏海钧豪宅被拍卖 年薪2亿被誉"打工皇帝"

头条要闻

恒大原总裁夏海钧豪宅被拍卖 年薪2亿被誉"打工皇帝"

体育要闻

成立128年后,这支升班马首夺顶级联赛冠军

娱乐要闻

50岁赵薇脸颊凹陷沧桑得认不出!

科技要闻

美国政府强力下场 苹果英特尔达成代工协议

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

健康
艺术
时尚
本地
军事航空

干细胞能让人“返老还童”吗

艺术要闻

齐白石 紫藤蜜蜂

你敢变重6公斤吗?

本地新闻

用苏绣的方式,打开江西婺源

军事要闻

美伊突然再次交火 伊朗外长:战争准备程度是1000%

无障碍浏览 进入关怀版