网易首页 > 网易号 > 正文 申请入驻

Z Waves|3年干出280亿估值AI独角兽,前PyTorch负责人、复旦校友乔琳证明:技术务实是AI创业的最佳路径

0
分享至


乔琳的技术根基,始于复旦大学计算机科学专业的系统培养。本科与硕士阶段的深耕,让她吃透了计算机科学的底层逻辑;随后赴美深造,在加州大学圣巴巴拉分校(UC Santa Barbara)斩获计算机科学博士学位,更让她站上了全球AI科研的前沿阵地。这段横跨中外的学术经历,不仅赋予她扎实的理论功底,更培养了她“从科研到落地”的全局思维——这也成为她日后打破“技术实验室壁垒”的核心竞争力。

然而真正让乔琳跻身全球AI核心玩家行列的,是她在Meta主导PyTorch生态建设的经历。彼时,PyTorch尚是科研圈的小众工具,而乔琳带领300余人的工程团队,开启了一场框架革命:她主导重构PyTorch的底层架构,使其突破仅能在实验室运行的局限,成功适配Meta的数据中心、移动端及AR/VR设备,构建起从模型研发到生产部署的全链路平台。最终,PyTorch从“小众工具”蜕变为支撑全球数百万开发者的行业标杆,成为AI模型训练与推理的“基础设施”,而乔琳也因此成为全球AI框架生态的核心奠基人之一。

离开Meta后,乔琳选择以创业延续技术理想,创立Fireworks AI,将突破点瞄准了大模型推理的“效率痛点”。她带领团队研发的两大核心技术,直接击中行业关键瓶颈:其一,Fire Attention推理引擎通过无损量化压缩技术,在几乎不损失精度的前提下,将模型运行精度从16位降至8位甚至4位,让资源消耗大幅锐减;其二,推测执行引擎打破“逐字生成”的传统模式,通过一次预测多个词序列再反向验证,彻底突破推理速度瓶颈。这两项技术的叠加,让LlamaDeepSeek等主流开源模型的推理速度较行业标杆vLLM提升12倍,同时成本降低53%,为大模型的普惠化扫清了关键障碍。



图片来源:
Fireworks

Meta带出来的改代码习惯,像一把钥匙,打开了Fireworks AI进入行业的大门让英伟达从最初的A轮投资方,慢慢变成了既要合作又要警惕的竞争对手。而乔琳自己,从复旦大学机房里啃馒头改算法的姑娘,长成了AI推理服务赛道上,最懂“把复杂技术做简单”的华人女性创业者。

一、从PyTorchFireworks24年技术生涯里的问题清单

乔琳的办公桌上,始终摆着一个磨破封面的笔记本。翻开第一页,是1995年复旦大学计算机系的课堂笔记,页眉处用红笔写着:“数据库索引能不能更轻?”再往后翻,2001年加州大学圣巴巴拉分校的博士论文草稿里,画着密密麻麻的“拆分箭头”——把大型计算任务拆成小节点分布式处理,导师当年笑称“像把大象拆成积木,却拼得更灵活”。

这本“问题清单”,记了24年。从IBM做研究员时记下“企业级AI服务成本太高”,到LinkedIn标注“用户数据与模型训练的矛盾”,再到Meta主导PyTorch框架开发时,贴满开发者的吐槽便签:“大模型好用但跑一次要花半个月预算”“开源模型便宜却调不通”。



图片来源:
PyTorch

2019年某个深夜,乔琳在Meta的实验室里改代码到凌晨。一位初创公司的开发者抱着电脑找到她,眼圈通红:“我们想用PyTorch做电商推荐模型,可租不起GPU,跑一次数据就要花掉三个月经费。”那天她陪着对方坐了3小时,把原本100亿参数的模型拆成三个小模块,按用户行为分阶段调用算力,最后成本降了60%。开发者走时反复说:“要是能有现成的‘轻量+定制’服务就好了。”

这句话像颗种子,落在了“问题清单”的最后一页。2021年,乔琳翻完17本笔记,突然在白板上画了个交叉图:横轴是“开源/闭源”,纵轴是“轻量/定制”,交点处写着“Fireworks”,这一个个简短的关键词就是乔琳从始至终所追求的企业新定位——Fireworks应该同时具备开源的灵活性与闭源的易用性,并希望在以“轻量”为优势的同时,做到与其他模型相当的定制化。



图片来源:
chatgpt



图片来源:
fireworks

二、雷德伍德市的创业:不买服务器的算力调度师

2022年春天,乔琳带着六位Meta时期的老同事,在雷德伍德市租下一间小办公室。创业第一天,她没讲估值蓝图,而是把大家分成三组,每组认领一个从“问题清单”里抄来的痛点:“怎么整合闲置GPU”“怎么让API像点外卖一样简单”“怎么帮客户调模型不花钱”。

“别盯着参数做模型,要注重开发者的难处。”这是乔琳在公司成立大会上说的第一句话。她太清楚中小企业的困境——想做AI,却买不起英伟达服务器,更养不起顶尖算法团队。所以Fireworks AI从一开始就走了条“反常规”的路:不直接购买硬件,而是做“算力调度师”。

就像拼车软件整合私家车,乔琳团队把全球散落在科技公司、高校实验室的闲置GPU资源“拧成一股绳”。客户不用自己找服务器,只要通过Fireworks的API上传数据,就能直接调用这些整合后的算力。AI编程助手Cursor是最早的客户之一,创始人曾笑着说:“原本要花200万美元买服务器,现在用他们的API,每月只花15万,推理速度还快了3倍。”



图片来源:
Fireworks

但真正让Fireworks AI站稳脚跟的,是乔琳藏在背后的“技术杀器”——FireAttention推理引擎。2023年夏天,一家医疗公司找过来,想把基因测序数据的AI分析成本再降30%。乔琳带着技术总监在办公室睡了两晚,给FireAttention加了个“动态参数开关”:根据基因数据的复杂度自动调整模型参数,不用从头跑130亿参数的大模型,80亿参数加专有数据微调,精度反而提升了2%,成本直接砍了一半。

“这就是我们的护城河。”乔琳指着测试报告说。那时Fireworks的年化营收ARR刚突破1亿美元,但80%的客户都在复购时追加了“微调服务”——比如Perplexity把70%的推理业务迁过来,只因FireAttention能让搜索响应快0.3秒;阿里Qwen团队用它做模型压缩,原本需要两周的调试,现在3天就能完成。

2023年11月14日凌晨两点,Fireworks AI的技术实验室突然爆发出一阵掌声。乔琳盯着监控屏上跳动的数字——自研的FireAttention推理引擎,GPU算力利用率从行业平均的65%硬生生拽到了92%这意味着客户的AI模型推理成本能直接砍半。不过在此之后,乔琳将企业的新方向转至——企业模型微调。

就是这个在算力突破当晚拍板的决定,让Fireworks AI在半年后估值冲刺40亿美元,吸引Lightspeed、Index等资本争相入局;也让英伟达从A轮投资方,悄悄将这家初创公司标为“重点关注竞争对手”。而站在白板前的乔琳,指尖还沾着马克笔的墨渍,恍惚间想起20年前在Meta调试PyTorch框架时,也是这样凭着一行代码的突破,推翻过既定的技术路线——这位从复旦机房走出来的华人女性,似乎总能在技术与市场的交叉点上,踩准改变命运的节拍。

三、当英伟达成为竞争对手,乔琳却微笑选择共赢——要一起把蛋糕做大



图片来源:
Fireworks

2023年A轮融资时,英伟达的投资经理坐在乔琳对面,抛出一个尖锐的问题:“如果我们自己做推理服务,你们怎么办?”

乔琳没回避,递过去一份客户清单——上面全是医疗、金融行业的“小而精”需求:帮银行调信用评估模型,要符合合规要求;帮药厂做分子模拟,要适配特殊实验数据。你们做的是算力水电网,我们做的是水电网上的定制水龙头她指着清单上的微调需求,这些活儿,巨头不愿做,小企业做不了,刚好是我们的位置。

这句话让英伟达投了钱,也让双方的关系变得微妙。2024年3月,英伟达收购推理服务商Lepton,推出自己的GPU云市场,从硬件供应商直接变成了下游服务竞争者。消息传来那天,乔琳反而在团队例会上笑了:“这证明我们选的赛道对了。”

她早有准备。在Fireworks AI的技术路线图上,“反哺硬件优化”成了新方向——通过FireAttention引擎积累的千万次微调数据,反向给英伟达提GPU优化建议。比如针对金融模型的稀疏计算需求,他们和英伟达联合开发了专用算力调度插件,让GPU在处理这类任务时,效率再提15%。“竞争不是你死我活,是一起把蛋糕做大。”乔琳说。

这种“差异化共存”的智慧,藏在她的“问题清单”里。早在Meta时期,她就记下过:“巨头的优势在规模,我们的机会在细分。”如今Fireworks AI的客户里,有70%是英伟达云服务覆盖不到的中小企业,这些客户需要的不是“通用算力”,而是“懂行业的微调方案”——就像有家做AI教育的初创公司,用Fireworks的服务把题库模型调了12版,最终实现“学生错一道题,模型马上推同类考点”,这种定制化能力,正是英伟达暂时给不了的。

四、AI界的实干派,把用不起改成用得好



图片来源:
Fireworks

在硅谷的华人AI创业者圈里,乔琳不算最张扬的。当别人忙着在行业论坛上讲“大模型参数竞赛”时,她在跑客户;当资本追着“通用AI”概念跑时,她在改FireAttention的代码。

“华人创业者的优势,从来不是跟风,是把技术‘磨’到落地。”乔琳想起刚到美国时,导师让她做一个分布式计算项目,她花了三个月,把一个复杂算法拆成20个小模块,每个模块的运行时间精确到毫秒。导师说:“你有把‘大象拆成积木’的耐心。”

这种耐心,现在成了Fireworks AI的标签。2024年,当公司估值冲向40亿美元,年化营收逼近3亿美元时,乔琳依旧把大部分时间泡在技术团队。有次为了修复一个API漏洞,她陪着工程师改代码到凌晨,饿了就像在复旦机房时那样,啃两口抽屉里的饼干。

“AI不是地壳式重组吗?重组的不是技术,是每个行业的做事方式。”乔琳在最新的“问题清单”上写下这句话。现在她的办公桌上,摆着两样东西:Meta时期的PyTorch代码本,和Fireworks AI客户的“微调需求清单”。前者记着“怎么把模型做轻”,后者写着“怎么把模型用对”。

当华人创业的AI公司估值总额超过300亿美元,乔琳知道,自己不是孤身一人。从Scale AI的 Alexandr Wang,到Pika的郭文景,华人创业者正在用“技术务实”改写AI行业的规则。而Fireworks AI的故事,更像一个缩影——不是靠概念造势,不是靠参数竞赛,而是把每个客户的“用不起”,改成“用得好”,一锤一锤凿出属于自己的护城河。

2024年深秋,乔琳在公司官网更新了slogan让每个企业都能用对’AI这句话的笔迹,和她1995年在复旦“问题清单”上写的“把每个算法都做轻”几乎一样——工整里带着点“轴”,就像她这个人:从江南小城到硅谷赛场,从改代码的姑娘到40亿独角兽的掌舵者,变的是舞台大小,不变的是那份“把复杂问题做简单”的初心。

在AI创业的热潮里,有人追风口,有人造泡沫,而乔琳用Fireworks AI证明:真正的独角兽,从来不是估值堆出来的,是像打磨FireAttention引擎那样,在技术与市场的缝隙里,把每个“痛点”磨成“亮点”,慢慢长出来的。


Reference

搜狐|复旦才女创业
AI
推理,估值超
5
亿美元

https://www.sohu.com/a/803134078_403354

[2]36
氪|
288
亿,复旦女学霸
3
年干出一个独角兽

https://m.36kr.com/p/3407737936137857

[3]Google PyTorch

https://www.google.com.hk/search?q=pytorch&rlz=1C9BKJA_enHK1179HK1179&hl=zh-CN&sourceid=chrome-mobile&ie=UTF-8

[4]Google Fireworks

https://fireworks.ai/

[5]DeepTech
深科技|一年飙升
7
倍,复旦校友、前
PyTorch
负责人创办的
AI
云服务初创估值冲刺
40
亿美元

https://zhuanlan.zhihu.com/p/1933586626916881606

[6]
头条|
AI
创业圈又冲出一个
288
亿独角兽
https://m.toutiao.com/article/7538640901263016457/?webview_progress_bar=1&show_loading=0&upstream_biz=doubao&push_animated=1&theme=light

[7]
头条|当华人女性按下
AI
加速键:
Fireworks AI
与她的
独角兽
征程

https://m.toutiao.com/article/7536116477800268297/?show_loading=0&webview_progress_bar=1&push_animated=1&upstream_biz=doubao&theme=light

欢迎扫码加群参与讨论

我们相信认知能够跨越阶层,

致力于为年轻人提供高质量的科技和财经内容。

稿件经采用可获邀进入Z Finance内部社群,优秀者将成为签约作者,00后更有机会成为Z Finance的早期共创成员。

我们正在招募新一期的实习生

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
湖南女子远嫁广东后晒月子餐,75岁奶奶眼泪流下来:吃不惯就回来

湖南女子远嫁广东后晒月子餐,75岁奶奶眼泪流下来:吃不惯就回来

糖逗在娱乐
2025-11-01 15:51:21
又被小米投诉了!远离雷军,保命要紧

又被小米投诉了!远离雷军,保命要紧

公子麦少
2025-11-01 22:57:15
顶住油价下滑!“三桶油”前三季度净赚2582亿元,中石油扛起盈利半边天

顶住油价下滑!“三桶油”前三季度净赚2582亿元,中石油扛起盈利半边天

澎湃新闻
2025-11-01 17:44:27
市政协副主席王红侠,跨省任副市长

市政协副主席王红侠,跨省任副市长

新京报政事儿
2025-11-01 09:59:40
王祖蓝自曝怕不能活过明年,已立遗嘱财产归太太,父亲46岁离世成心坎

王祖蓝自曝怕不能活过明年,已立遗嘱财产归太太,父亲46岁离世成心坎

In风尚
2025-10-28 18:26:15
处决吴石那天,陈诚叫停了台湾所有的死刑,是怜悯还是算计?

处决吴石那天,陈诚叫停了台湾所有的死刑,是怜悯还是算计?

历来纵横
2025-11-01 22:11:58
理想汽车向上海MEGA起火事故车主致歉 并宣布召回同批次车辆

理想汽车向上海MEGA起火事故车主致歉 并宣布召回同批次车辆

TechWeb
2025-11-01 09:50:06
陈道明也没想到,兢兢业业演一辈子戏,却在70岁这年“名声尽毁”

陈道明也没想到,兢兢业业演一辈子戏,却在70岁这年“名声尽毁”

草莓解说体育
2025-11-02 03:59:32
诺丁汉森林2-2曼联,赛后评分:不是B费第一,曼联16号排第一

诺丁汉森林2-2曼联,赛后评分:不是B费第一,曼联16号排第一

侧身凌空斩
2025-11-02 00:55:25
孔蒂:除了点球以外,我不记得小米林科维奇还有任何扑救

孔蒂:除了点球以外,我不记得小米林科维奇还有任何扑救

懂球帝
2025-11-02 04:17:14
演员倪妮发律师声明,否认“有后台”等传闻,表示将通过法律维权

演员倪妮发律师声明,否认“有后台”等传闻,表示将通过法律维权

极目新闻
2025-11-01 12:11:28
41岁白百何罕见露面,她的下胯变得好大呀,脸也胖了,像个大妈

41岁白百何罕见露面,她的下胯变得好大呀,脸也胖了,像个大妈

广西阿妹香香
2025-10-29 16:09:46
成“老赖”不到72小时,于谦资产被扒底朝天,杨议的话有人信了

成“老赖”不到72小时,于谦资产被扒底朝天,杨议的话有人信了

科学发掘
2025-10-31 14:06:52
江一燕这腰非得要露出来吗?腰上这一圈肉还挺让人出戏的

江一燕这腰非得要露出来吗?腰上这一圈肉还挺让人出戏的

TVB的四小花
2025-11-01 14:36:44
德云社知名相声演员于谦!突发!

德云社知名相声演员于谦!突发!

黄小仙的搞笑视频
2025-10-30 11:41:15
老太被骗光积蓄后脑溢血身亡,警察听完录音却说:骗子知道她的小名

老太被骗光积蓄后脑溢血身亡,警察听完录音却说:骗子知道她的小名

悬案解密档案
2025-11-01 16:41:55
2-1,21岁皇马租将和28岁皇马旧将发威,率队3连胜+逼近西甲前四

2-1,21岁皇马租将和28岁皇马旧将发威,率队3连胜+逼近西甲前四

凌空倒钩
2025-11-01 06:49:14
狂揽10亿,“跑鞋新贵”闷声发大财!网友:不烂街不坑中产

狂揽10亿,“跑鞋新贵”闷声发大财!网友:不烂街不坑中产

财经八卦
2025-10-13 21:09:19
心爱的硅胶娃娃被室友锁上门猛干,男子“抓奸在床”气哭报警获赔7766元

心爱的硅胶娃娃被室友锁上门猛干,男子“抓奸在床”气哭报警获赔7766元

可达鸭面面观
2025-10-11 15:09:06
5种染发剂被曝含致癌物,看看你正在用吗?转告父母:谨慎购买

5种染发剂被曝含致癌物,看看你正在用吗?转告父母:谨慎购买

丁铗惊悚影视解说
2025-10-31 19:01:29
2025-11-02 04:43:00
ZFinance
ZFinance
Z世代的一站式AI、科技和财经资讯
58文章数 2关注度
往期回顾 全部

科技要闻

事关安世半导体,商务部最新发声!

头条要闻

美国防长国务卿受威胁 躲进军事基地

头条要闻

美国防长国务卿受威胁 躲进军事基地

体育要闻

NBA球员,必须吃夜宵

娱乐要闻

王家卫这波录音,撕烂了遮羞布

财经要闻

段永平捐了1500万元茅台股票!本人回应

汽车要闻

换新一口价11.98万 第三代蓝电E5 PLUS开启预售

态度原创

数码
本地
亲子
旅游
公开课

数码要闻

预热 2026 FIFA 足球世界杯,闪迪推出多款授权设计存储产品

本地新闻

全网围观,到底多少人被这个野人大学生笑疯了

亲子要闻

子宫写真火遍法国!不去医院就可看性别,还能给胎儿“打印”一张脸

旅游要闻

运河明珠,千年守望:杭州拱宸桥的前世今生与文化密码!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版