
“从边缘云到Agent沙箱,PPIO为什么敢押注每一个「不被看好」的方向?”
作者丨赵之齐
编辑丨包永刚
2018年,边缘算力与CDN(内容分发网络)市场已白热化,价格卷到极致。就在这一年,PPIO成立了。他们毅然切入边缘云领域,直面红海的竞争。
当时,创始人姚欣给天使投资人——百川智能创始人王小川、前微软Azure中国总裁申元庆——讲的创业逻辑是:
“当年PPTV就是整合闲置的算力和资源,建起来的一套分布式平台。我们二十年前就在做C端的算力整合,现在要去做B端,你想,是整合B端难还是C端难?”
在2005年便创立了PPTV、并在2014年将其出售给苏宁的姚欣,与当时PPTV的首席架构师王闻宇转战B端算力领域,显然是值得被信任的。于是,这个故事被投资者们接受了。
然而,这一路的起步并不如想象中容易。起初,PPIO在“先找供给”还是“先找需求”间久久徘徊,商业难以闭环,直到疫情导致线上流量激增,才逐渐跑通了这一增长曲线。
2023年,当疫情带来的线上流量红利逐渐消退,GPU市场也开始利润暴涨,H100的高点价格甚至一度达到400万元。GPU贸易赛道火热之时,姚欣却拒绝了这门“稳赚不赔”的生意,在那个基础大模型训练正盛的年代,提出了要“聚焦推理”。
![]()
PPIO联合创始人兼CEO 姚欣
如今,短短几年时间,PPIO的营收已经实现指数级增长,2024年营收已达5.58亿。而在今年7月的WAIC(世界人工智能大会),PPIO又成了国内首个推出兼容E2B的Agent沙箱的公司——
Agent沙箱作为专为AI Agent场景设计的基础设施,能为AI Agent提供隔离运行环境,让Agent在安全、受限的条件下执行代码。由此,防止Agent访问或篡改系统之外的资源,避免对系统造成损害。
在整个研发过程中,姚欣感慨,最难的便是“为看不见的需求做技术”。
而这,也是PPIO这两年一直在做的事——比行业走快一步。
如今,PPIO正在冲刺港股IPO。从边缘云到GPU推理平台,再到Agent沙箱,PPIO成为了具备全栈技术能力的AI云服务商,这些跨度背后是如何考量?在国内云大厂夹击下,作为创业公司的他们如何突围?
以下,是雷峰网与姚欣的对话。
01
为看不见的需求做技术
雷峰网:你们从2018年创立做云服务,起初的算力做到现在的沙箱,跨度很大,这条路是怎么走下来的?
姚欣:我们2022年开始进入GPU领域,当时AI大语言模型还没开始,最开始做的是云游戏和云渲染的GPU,这天生就是一个分布式架构。
2023年大语言模型起来后,整个市场开始起来。当时国内某头部模型厂商发布了自己的开源模型,但缺少推理平台,我们就帮着他们在2023年搭建了第一代推理平台服务,这是我们的第一个推理的Infra客户。
2024年,PPIO就开始在重点聚焦出海,集成了大量开源的模型,把模型API推出一整套MaaS平台。
今年年初,PPIO再往上走一层,Agent其实就类似于PaaS层,相当于我们从底层技术栈一层层长上来。
雷峰网:在这之中,挑战主要是什么?
姚欣:最大的挑战就是,我们是为看不见的需求在做技术。
做AI Infra或技术平台现在看起来已经普及了,但在2024年做MaaS、或者现在做AI PaaS Agent,用黄仁勋的话讲,就是“Zero/Billion dollar company market”,一个零/亿市场,现在是0,也许以后就是10亿、20亿、百亿。要为一个今天还是0的市场,提前做技术储备、研发、投入;但如果看到Manus起来后再开始做沙箱,其实就已经晚了。
雷峰网:在2022年决定切入做算力云的时候,内部是怎么去讨论这个市场的?
姚欣:当时还没看到GPT,我们更多是从公司要打造第二增长曲线的角度。
在此之前我们第一增长曲线是基于CPU做的边缘云,那会儿主要是抓住了疫情期间在线流量激增带来的业务需求。我们当时为很多头部互联网公司提供音视频处理、边缘计算和传输服务,都是基于传统CPU和云架构。2022年疫情逐渐结束了,流量慢慢回落,我们就意识到要开始找第二增长曲线了。
雷峰网:但如何锚定现在这个方向的呢?
姚欣:我们作为云服务商,其实大的思路就是计算、存储、传输。半年后,ChatGPT开始风靡,国内掀起大模型创业热潮,看到大模型类企业快速融资、扩张的态势,我们就明确将第二增长曲线定位为AI赛道做AI Infra,从GPU层逐步向上构建到今天的PaaS。
雷峰网:当时很多人都想做算力贸易生意,你们是怎么决定要去做分布式算力的路线?
姚欣:我们选择避过热点,没有参与任何倒算力囤卡,这跟整个公司的价值观都有关系——我们价值观第一条叫“价值创造”,一定要做有技术附加值的东西。
我们在GPU领域的商业模式是整合汇聚大量闲置的分布式算力,再把它变成某种云服务。我们技术附加值的体现,主要就是把闲置算力token化。
雷峰网:你们是怎么找到这些闲散资源的呢?这些资源的持有方会是谁?
姚欣:2022年看到的都是游戏显卡,用4090、3090做渲染,甚至最开始Stable Diffusion就在4090上面跑的。后来看到上一代训练的GPU大量闲置,例如2024年大家都开始拿H100做训练,A100被替换,我们就拿闲置的A100来跑推理。
再往后又看到很多国产GPU用不起来,有的国产GPU智算中心利用率只有10%-20%,我们就又开始做国产GPU和模型推理加速框架的适配。今年我们平台上就有很多头部厂商的国产GPU。
雷峰网:所以你们一方面是用那些已经被时代选择淘汰了的算力,另一方面是国产算力,而且对标推理市场,没有去碰算力训练这一块。
姚欣:对,因为训练和推理的任务指标不一样。一个模型比别人先推出是很重要的,所以训练永远用最先进的芯片;但推理不一样,推理要求极致的成本性价比,结合我们独特的分布式闲置资源整合的能力,降低创业者使用算力门槛。
02
不绑定+开源:AI开发者的“反锁定”需求
雷峰网:PPIO在WAIC上发布了沙箱,似乎是国内首发的Agent沙箱。为什么会在这个时间点上去推呢?
姚欣:要加一个补充,这是我们“在中国”首发E2B兼容的Agent沙箱,在海外已经提前发布了。
我们在2023年选择出海,在海外优先寻找一些战略客户或早期的新技术,和他们一起快速打磨和迭代,推动底层AI Infra开发技术栈的创新。
雷峰网:现在沙箱进展如何?
姚欣:目前我们在海外落地比国内快一些,PPIO推沙箱对标海外E2B,他们在硅谷今年一年用量大概涨了400多倍,从4万多到1600多万。国内过去的模型合作伙伴像是千问、Kimi、智谱等等,这几家模型能力基本可以追平年初的Anthropic,所以我判断未来几个月中国版的Manus或Cursor可能会更快速增长。
雷峰网:在你们推出沙箱后,大厂也在跟进了,会担心和大厂之间的竞争吗?你们和大厂的差异性在哪里?
姚欣:从我创办第一天,投资人就开始问我们这个问题,但现在到了Agent或PaaS这一层,话题就开始有趣起来了。
之前做云计算,在IaaS层,说白了就是拼资源、拼规模,是一个Heavy Capex(资本性支出)的游戏。到PaaS层,虽然巨头影响力还是巨大的,因为他们原来的客户积累和生态依然是最强的,但到了Agent Infra这一层,云大厂的影响力和PC以及移动时代相比,是大幅削弱的。
雷峰网:为什么有这个观察?
姚欣:具体是以下这几个原因。
第一,GPU的Infra架构是在过去三年时间里突然冒出来的,不像CPU有将近20年发展,所以大厂很难有很明显的先发优势或很强技术积累,今天大厂真正做沙箱这件事,跟PPIO可能也在差不多一个体量。
第二,这波AI成本太高,所以各家公司包括开发者,第一天设计自己的架构时就是跨云、多云或者可以灵活调用的架构,追求一整套标准化的接口,不会跟某家厂商特别绑定。我们就把API能力做好,作为一个组件;与此同时,也拥抱开源。
这代AI开发者不像上个时代的移动互联网开发者,选择某个云后就在上面越存越多,慢慢配套一堆私有化的组件调用、或者专有组件调用,牢牢被它绑住了。我们在国内和差不多四五十款主流的开源框架有对接合作,而且也没有想把GPU和CPU绑在一起销售,就是想基于开源和可迁移性去方便开发者。
雷峰网:所以现在的沙箱主要目标市场就都是开发者吗?
姚欣:其实不光是沙箱,包括提供的API、很多GPU的Serverless等等,我们过去两年主要都是为了AI Startup和开发者两个人群提供服务。
雷峰网:这个群体的市场足够大吗?
姚欣:这些开发者和新应用,在用量侧其实比很多传统互联网巨头高很多。前段时间Sam Altman也说了,Open AI的Top20消耗里,70%以上都是AI新应用,我们想争取这种全新增量用户。
而且过去几年有个特点,新的AI创业公司和应用公司出来,他们做一件事的token消耗,可能比上个应用直接提升10倍甚至100倍。比如Manus执行一个任务,调用的token可能是几十万次.
今年7月,Manus还发布了个Wide Research,一个任务同时开100个Agent在跑,这100个Agent同时得出一个结果、最后返回一个最佳解,这个消耗量就相当于再增长100倍。
03
AI赌的是下一代
雷峰网:你认为分布式算力厂商的优势在哪里?
姚欣:第一是节点数量要足够多、任务需求也要多。我们的优势在于技术栈和传统云公司完全不一样:我们从第一天就是在分散、碎片、异构的基础设施上建立起来的云服务,所以叫“分布式云”,但传统大云厂的技术栈,是建立在集中式、大规模标准的数据中心上做的虚拟化加技术栈。
很多企业级算力也是用这种方式整合起来。有些互联网企业,比如做电商的,旺季在双十一、618,但上半年利用率其实很低,周一到周五还会比周末低,他们就很需要在闲置时把这些资源用起来。
雷峰网:目前PPIO有4000多个节点,这些节点是如何分布的?
姚欣:这些节点很多是零售型IDC,他们随时可以把机器在闲置期内托管到我们平台上供调用,相当于有这么多“滴滴司机”随时待命,但不代表他们24小时都在服务。
真正要调用时,就要看客户场景,有的应用场景追求低延时,会就近调用;有些比较成本敏感,就可以比如给北京的用户调新疆的资源——新疆电费是北京的1/3,甚至全球范围内,东半球的白天是西半球的凌晨,可以跨更大的区域调度。
雷峰网:最开始分布式算力云的客户也是这些开发者相关吗?
姚欣:不是,分布式CPU云是头部的互联网那个公司。但到了GPU云时代,主要是以AI创业者和开发者为主。
雷峰网:为什么有这套策略的转变?
姚欣:我们现在更想和客户一起联合打磨未来新产品,所以选择开发者和AI创业公司, AI时代不一样,AI是赌下一代,下一个字节、下一个抖音在哪里?现在还没有出来。
雷峰网:那未来对分布式算力的挑战会在哪里?
姚欣:还是在需求侧,技术侧和供给侧不担心,就看需求侧什么时候能有大规模爆发,尤其是重视时延敏感的需求。
04
创业成果是认知的变现
雷峰网:听起来是2020年疫情需求起来后,边缘CPU才真正利用起来。但你们在2018年就已经开始做这个业务,最开始遇到了什么挑战?
姚欣:最早的挑战就是“鸡生蛋”还是“蛋生鸡”的问题,或者说,所有平台生意的第一点都是:先抓供给还是先抓需求。
抓需求吧,大家说你技术不成熟、网络覆盖广度不够、没有全国节点;但是到处找全国节点,大家就会问你需求呢?
当年这个平台能冷启动,很大原因是2020年疫情爆发,需求超出预期,我们才能有技术打磨、锁定更多供应商。到今天GPU这张网络也是类似的,过去一年我们平台token消耗增长了一百倍以上,推理时代这种极其陡峭的高增长曲线才能把GPU网络拉起来,所以我们现在也在找下一个更高增长爆发的新需求。
雷峰网:那当时PPIO成立,在CDN红海里做边缘云,是怎么说服王小川、申元庆等人投资的?毕竟他们都是很懂云的人。
姚欣:2018年,第一波AI计算机视觉很热,有大量算力需求、也有很多算力被闲置,尤其很多数字新基建IDC,建完没用起来。我跟他们讲的故事很简单:我们二十年前就在做C端的算力整合(指PPTV),现在要去做B端的算力整合,你们想想是整合B端难还是C端难?
技术上肯定是C端更难更复杂,商业模式上B端也可能更成熟一些,后来这个故事大家就听到了,觉得我们团队是做PPTV分布式计算、分布式网络出身,调度能力足够强。
雷峰网:现在回头看,在PPIO创业的过程中,您觉得自己做得很对的一个判断是什么?
姚欣:2023年我们就提出聚焦推理、聚焦开源、海外优先,这个认知当时比同行要早很多,当时开源模型还没几个。现在能抓住这波DeepSeek机会、以及海外这么多知名开发者,和三年前这个判断非常关键。我们在整个战略趋势和方向的判断上,还是比当年做PPTV强太多。
雷峰网:回头看,您感觉创业重要的能力是什么样的?
姚欣:我觉得最重要的就是认知能力,如何不断学习、快速适应,并不断提升认知能力的上限。我们公司是动漫文化,我是海贼王路飞,海贼王里有恶魔果实,如果选一个果实,我最想吃的是学习果实,因为对于一个创始人来讲,最重要的就是认知能力,包括我做投资人的三四年里来看,最后的成果都是认知变现。
这二十年间,技术的发展也经历过多个周期,我很清楚下一个周期要发生什么,加上我总是到处飞,去看最先进的模型和技术生态、跟全球最新锐的创业者在一起,我们对技术和商业的结合、对全栈的理解可能会比业内其他竞争对手更快更强。
雷峰网:那现在会有什么新的判断吗?
姚欣:Agent Infra会是下一代的AIOS。
作者长期关注半导体、算力上下游等方向,欢迎添加作者微信Ericazhao23交流。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.