![]()
你刚在GTC听完黄仁勋说"数据中心就是token工厂",转身就发现有人已经在建这座工厂的管道系统了。以色列创业公司NeuReality周一宣布,挖来Google Labs产品管理总监Shalini Agarwal担任战略顾问——不是挂名,是实打实要帮她家推理操作系统NR-NEXUS打进企业市场。
从芯片到软件:一家以色列公司的"断臂求生"
NeuReality的故事有点曲折。这家公司最初是做AI推理专用芯片的,后来整个儿调转船头,押注软件层。现在的NR-NEXUS被包装成"硬件无关的推理操作系统",说白了就是让一堆乱七八糟的GPU、CPU、网卡能协同干活,别让昂贵的算力卡在那儿空转。
这个转向发生在2024年9月前后。当时前GlobalFoundries和Intel Capital高管Hiren Majmudar加盟担任总裁,已经暗示了战略重心的迁移。Agarwal的加入是这盘棋的最新一步——她带着近二十年的产品策略经验,在Google Labs管过AI产品线,之前在eBay待了将近十年,MIT的计算机+电子工程+管理科学三学位背景。
不过要厘清一点:她的职位是adviser,不是全职操盘。真正掌舵的还是联合创始人兼CEO Moshe Tanach。但硅谷大厂总监的名头写在新闻稿里,对一家想敲开企业大门的以色列公司来说,本身就是张信用背书。
NR-NEXUS到底在解决什么问题
3月12日,NeuReality正式发布了NR-NEXUS。技术文档里的关键词是"disaggregation"——把大模型的prefill(预填充)和decode(解码)两个阶段拆开,扔到不同的硬件上跑。
这么做有个现实背景:企业买的GPU集群往往是 heterogeneous(异构)的,NVIDIA的新旧架构混着用,可能还插着些CPU和专用网卡。传统做法是让每块卡自己啃完整的推理流程,结果就是有的卡忙死、有的卡闲死,整体利用率难看。
NR-NEXUS想当的是这层调度中间件。按NeuReality的说法,它支持任何CPU、GPU、NIC,包括NVIDIA还没正式出货的Vera Rubin架构。Beta客户已经在跑了,但具体是谁——公司嘴很严,一个名字都没漏。
这个市场timing卡得微妙。Deloitte的估算显示,2025年推理 workload 占AI算力消耗的50%,今年要冲到三分之二。亚马逊喊出了2026年2000亿美金的资本开支,Google也准备了1750-1850亿美金。但这些钱大部分流向了垂直整合的封闭体系——AWS的Trainium、Google的TPU、NVIDIA的完整软件栈。想买混合硬件自己搭 inference infrastructure 的企业,选择其实不多。
Agarwal要啃的三块硬骨头
NeuReality在新闻稿里明说了目标客群分三类:neocloud provider(新兴云服务商)、企业自建AI工厂、以及想优化现有GPU利用率的传统数据中心。每一类都是硬茬。
Neocloud这边,CoreWeave、Lambda Labs这些玩家正在疯狂抢市场,但它们的核心竞争力是拿卡能力和融资速度,对"第三方调度软件"的接受度存疑——多一层抽象就意味着多一层潜在故障点。
企业客户更现实:CIO们2024年被"AI转型"忽悠怕了,2025年预算审批格外严格。NR-NEXUS要证明的不是技术先进性,是ROI——装上之后,现有GPU能多挤出多少有效算力,多久能回本。
至于传统数据中心,这是最讽刺的一类客户。他们手里可能攒着各种型号的NVIDIA卡,甚至还有些AMD的MI系列,但运维团队的学习成本是真实存在的。NeuReality的销售得说服他们:为了省20-30%的算力浪费,值得再引入一套全新的软件依赖。
Agarwal在Google Labs的经历在这里可能派上用场。那是个专门孵化和早期产品化的部门,擅长把技术demo包装成可售卖的企业方案。她在eBay的十年则覆盖了电商平台的规模化运营——对" heterogeneous infrastructure "的痛点不会陌生。
推理赛道的"隐形战争"
NeuReality的赌注背后,是整个AI基础设施层的权力重构。训练阶段NVIDIA的统治地位几乎不可撼动,但推理阶段的故事还没写完。模型压缩、量化技术、专用芯片、调度软件——每个环节都在争夺"谁能在每一美元算力里榨出更多token"。
NR-NEXUS的定位有点像Kubernetes早期的故事:不是替代底层硬件,而是让上层应用不必关心硬件差异。但Kubernetes花了近十年才被企业广泛接受,NeuReality没有那么多时间窗口。推理经济学的压力是即时的,客户要的是下季度就能体现在财报上的成本节省。
另一个不确定因素是NVIDIA自己的软件栈演进。CUDA的生态锁定已经很强,但黄仁勋在GTC上反复强调的"推理微服务"(NIM)和NeuReality的NR-NEXUS存在某种竞争关系——都是想让企业更容易地部署模型,只是NVIDIA想把自己绑得更紧,NeuReality想松一松。
NeuReality的新闻稿里有个细节值得玩味:他们特意提到支持Vera Rubin,这是NVIDIA下一代架构的代号,正式产品还没上市。这种"提前站队"的表态,既是对潜在客户的 reassurance,也是一种微妙的姿态——我们在NVIDIA的生态系统里,但不是它的附庸。
截至发稿,NeuReality尚未披露新一轮融资信息。公司上一次公开融资是2023年的3500万美元A轮,由Samsung Ventures和AnaMa Ventures领投。以当前AI基础设施赛道的估值水平,如果NR-NEXUS的Beta客户能转化为付费案例,下一轮应该不会太远。
Agarwal的LinkedIn页面尚未更新这条任命。Google Labs那边也没有回应置评请求——大厂高管的"顾问"头衔,有时候是离职过渡期,有时候是真心看好押注,有时候两者兼有。对NeuReality来说,重要的是这个名字出现在了周一的新闻稿里,在GTC的余温中,蹭上了"token工厂"的叙事热度。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.