三年狂揽22亿元，这支清华团队要建“Token枢纽”｜独家|算法|黄仁勋|token|算力基础设施

分享至

来源：中国企业家杂志

让中国所有能被用起来的芯片，都能以最高效率地产生Token。

文｜《中国企业家》记者闫俊文

见习编辑｜李原编辑｜何伊凡

图片来源｜受访者

对比前两年的艰难摸索，最近一年，夏立雪创业进入到了“低阻力超音速”的状态。

“前两年，Token规模尚未真正起量，我们要面对方向选择、节奏布局等没有标准答案的难题。现在赛道和需求都比之前清晰了，虽然不确定性依然在，但不一样的是，很多事情开始能落地、能衡量了。最初的判断正一点一点被验证，能朝着明确的目标全力跑起来，这已经是非常理想的创业节奏。”

5月7日，AGI基础建设服务商无问芯穹宣布，公司获得超7亿元融资，联合领投方为杭州高新金投集团和惠远资本，跟投方包括国兴资本、秦淮数据等，老股东君联资本、上海国投孚腾和元智未来追加投资。

无问芯穹联合创始人兼CEO夏立雪接受《中国企业家》独家专访时表示：“公司从2025年下半年就启动了这轮融资。当时，我们认为模型能力突破了商业化的临界点，大模型正从好技术到好产品，再到好产业转化。我们当时就预判，应该要储备更多弹药。”

夏立雪判断，AI产业已进入现金流闭环阶段。企业赚取的收入可重新投入生产，制造并输出高价值的Token，再通过商业化变现形成持续回款，实现可盈利、可循环、可扩张的成熟产业链。

而在整个AI产业链中，Infra层起着关键作用，它是整合芯片与能源的“Token工厂”，涵盖数据中心、冷却系统、网络架构等硬件设施，也是英伟达CEO黄仁勋所提出的五层蛋糕——能源、芯片、基础设施（Infrastructure）、模型、应用中的关键一层。

夏立雪认为，在供小于求的市场里，算力可能长时间供给不足。“不是最有钱的人就能占领最高的行业地位，而是最懂得做好优化的人。”

无问芯穹上一次融资是在6个月前，2025年11月，公司完成了5亿元A+轮融资。再向前追溯，2024年8月宣布完成近5亿元A轮融资，加上天使轮，无问芯穹公开披露的累计融资，已经超过22亿元。

无问芯穹成立于2023年5月，发起人是清华大学电子工程系教授汪玉，夏立雪、联合创始人兼首席科学家戴国浩、首席技术官李伯勋都曾是汪玉的学生。

汪玉在2025年9月的一次演讲中提到，如何优化单位能耗下的Token效率，将是AI 2.0时代基础设施与系统设计的核心命题。评价基础设施效能的核心指标已经发生了变化——传统的“每焦耳能量所能支持的计算次数（TOPS/J）”正被“每焦耳能量所能处理的有效Token数量（Tokens/J）”所取代。

无问芯穹将目标锁定为打造“最高效的Token工厂”，以及成为Token经济枢纽。这个定位比之前公司提出的“AI加速”和“送铲人”更为清晰聚焦。

面对国产芯片与海外高端算力并存、性能与生态参差不齐的行业现实，无问芯穹走出了一条以多元异构、软硬协同、自主化AI为核心的独特路径。目前，无问芯穹平台已接入包括Kimi、智谱、DeepSeek、通义千问、MiniMax等在内的头部大模型。

夏立雪坦言，国产芯片不必追求一步到位替代海外方案，而是要边跑边改、边用边优。真正的效率突破，是把不同算力放在最擅长的位置。

无问芯穹通过异构混训混推，实现了英伟达与国产芯片的混合使用，把大模型的预填充与解码、训练与推理、复杂算子与常规计算合理拆分，让每一分算力都实现了价值最大化。这得以让大模型厂商在逐步提升国产芯片承载比例的同时，不必损失3~6个月的迭代周期。

以Token为中心的商业模式正在让整个AI产业感到兴奋。对此，夏立雪提供了几个关键数据：第一，去年底至今年4月底，无问芯穹MaaS平台模型推理的Token用量以20倍速增长，并且增长量主要来自大规模商业化以及智能水平最好的模型。

第二，未来6个月，Token的使用量将供不应求，并会保持这种增速。

第三，Token涨价潮即将到来。夏立雪说：“涨价和成本降低这两件事情叠加起来，你就会发现这是一个盈亏平衡线的问题：Token价格上涨、同时成本降低，会使得原本某些领域亏本的生意变成赚钱。所以，AI最终的盈亏平衡线是能够在更多场合内取得正向收益。一旦取得正向收益，供需的飞轮就会转起来。”

DeepSeek-V4的发布，也让这条路径迎来关键拐点。V4发布的Pro与Flash双版本，兼顾了极致性能与普惠成本，为国产芯片提供了规模落地的最佳载体。

夏立雪认为，DeepSeek真正的价值，不仅是对硬件友好的优化，更是用开源生态与分层产品策略，把国产芯片真正带入商业化主航道。更多国产芯片有望被高效激活、规模化使用、持续迭代。

他预判，凭借电力、模型性价比等因素，中国未来会成为全世界的“Token生产工厂”。“过去Made in China是制造业，现在是AI Made in China。”

以下是夏立雪接受《中国企业家》独家专访的内容（有删减）：

行业仍在10倍速增长

《中国企业家》：作为产业上下游中间的Infra层，你预计今年的竞争是不是会格外激烈，会不会淘汰几家？

夏立雪：我认为不是。一个产业如果要淘汰公司，核心原因是需求饱和，从而出现白热化竞争。但目前AI产业需求非但没有饱和，还在大量增长，对上下游都有带动。既然整个产业都有更大的蛋糕可以切，中间任何一个阶段、任何一个层次，都会有更大的市场可以分。

具体到Infra这个赛道，它的价值是把底层资源发挥出更大的产能。如果现在国内的芯片够用了，才能谈得上饱和。但现在和未来很长一段时间，都是极度紧缺的状态。

黄仁勋在演讲中描述的基础设施，被他放入了“能源、芯片、基础设施、模型、应用”五层蛋糕体系内。大家能感受到这是一个万亿级的市场，我们在里面做到千亿、百亿的收入，都是很不错的状态。

现在更多的关注点，应该是自己的技术能不能进一步做好、能不能提供产业价值、客户认不认可我们的价值，以及能不能持续推出更好的产品迭代。这几件事情远比竞争关系重要得多。

《中国企业家》：所以AI Infra行业还是一个你追我赶的马拉松式竞争？

夏立雪：现在可能还谈不上竞争。蛋糕足够大，随便圈一块地，都可以先盖起一座自己的城市。大家都还在选择做哪一块市场，远没到需要拼刺刀的阶段。

《中国企业家》：在整个Infra层，无问芯穹相比于竞争对手，核心价值点在哪里？

夏立雪：在今天这个时间点，占据最高行业地位的不是最有钱的人，而是最懂得做好优化的人。

Token工厂的底层逻辑，就是对每单位资源所生产的Token，以及每Token所带来的生产力水平，进行优化。因此，我们一直是按照技术价值和产业价值打通的方式来做Infra。

在黄仁勋的AI产业五层结构中，基础设施立足在中间层，向上需要把算法和应用的know-how、业务的流量、尺寸和分布，都纳入到优化空间内；向下要把芯片结构，甚至能源建设都纳入考虑。所以基础设施是一个非常需要全栈技术能力的层次。

我们有很强的算法团队，也有很强的偏硬件团队，既能把算法中最好、最重要的计算保留下来，又让这些计算能丝滑地跑在硬件最擅长的结构上。这两者之间的打通，是Infrastructure最核心的竞争力，也是无问芯穹在行业里最独特的一点。

我们从成立最开始就立足软硬协同、多元异构的核心技术，做M种模型和N种芯片之间的联合优化，这些都是在宣告我们的立场：要把每一块芯片上的每一分算力、每一秒钟都压榨到极致，这就是我们为这个行业带来的价值。

《中国企业家》：一家国产大模型厂商说，算法迭代如果要适配国产芯片，至少要损失3到6个月的时间。基于国产算力、异构芯片，你们怎么去尽量弥补这个时间差，做到性能先进或者效率先进？

夏立雪：最重要的是把任务做合理的分工和拆解。以DeepSeek-V4为例，它有Pro和Flash（专业和快速）两个版本，参数量分别是1.6T和284B，面向不同的应用场景，有不同分工。

我们做多元异构，除了把A国产芯片和B国产芯片混在一起，更重要的是能够把国产芯片和英伟达芯片也混在一起。它们之间也形成分工，从又大又重、对算子库、性能、带宽都要求拉满的任务中，拆出国产芯片能够承担的子任务；而国产芯片暂时还不擅长、需要花一些时间才能应对的复杂任务，交给英伟达芯片处理。

我们之前还做过更难的事情：把训练任务也拆开，让两种芯片配合起来完成训练，混合下来的折损率在3%以下，达到97.6%的混合训练效率。

现在，我们能把大模型的推理，比如Prefill（预填充）和Decode（解码），拆在两种不同的芯片上，去做异构PD分离。

这就是无问芯穹的价值：通过拆解任务，让每份算力做最擅长的事情，不让用户“等”。对大模型来说，“等”是一个很可怕的机会成本，只要不让它等，就能边跑边改。

《中国企业家》：边跑边改会不会影响客户体验？

夏立雪：首先要让客户从体感上，认知到国产芯片是能用的。边跑边改之后，才有改的方向，因为Token工厂本身有很重要的飞轮：运行的业务越多，越能发现里面的优化空间。

对我们来说，整个Token工厂的价值，就是积累了更好的优化之后，提供更具性价比的Token。让更多的人来用，飞轮就转起来了。

所以，国产芯片的生态闭环非常重要。无问芯穹提供的核心价值，是我们通过对任务进行拆分，打通芯片之间的通信库，让芯片的容错、SLA（服务等级）能够稳定达到可用，最后再统一交付。

《中国企业家》：你怎么评价DeepSeek-V4的发布？

夏立雪：首先，它是相当好用的开源模型，DeepSeek继续把开源模型的生态体系推广下去，未来一定能看到更多应用在开源生态中爆发。

其次，V4模型有相当多的优化技术，也兼顾了硬件友好。比如它对Cache（缓存）的一些优化做得很好，使得用当前的硬件也可以去支撑非常长的Token上下文。未来Token使用量还会进一步快速增长，对Infra层也带来了更多的需求。

第三，同时发布Pro和Flash两个模型，是健康的模型规划。更大尺寸的Pro模型，追求AGI的实现；好用，但成本又没那么高的Flash模型，可以更好地把国产芯片用起来。

用户也是用脚投票的，DeepSeek之所以会花精力发布Flash模型，他们一定是发现了这个版本也能满足很多行业的需求。这意味着整个AI赛道都在走向更健康的状态，不再只有最尖端的模型大家才愿意用，200B量级的模型也有很多人愿意用。

点击封面订阅全年杂志

让国产芯片最高效率产生Token

《中国企业家》：无问芯穹正在打造最高效的“Token工厂”，你们之前是AI加速、所谓的“卖铲子”，这是不是一个定位的升级？

夏立雪：我不知道“升级”这个词算不算重，但我们核心技术的内核没有变化，一直都在研究怎么把每一分算力的价值发挥到极致。

更多从业者在训模型的时期，我们提供的是怎么把已有资源用得更好，更像是“递铲子”的工作。

现在，技术本身的目标没有变，但业务发生了变化，产品形式和商业模式也会随之自然转化：大量需求来自Agent和各行各业的客户。在这个时间点，只提供“发动机”，客户不一定能组装成最好的“流水线”，倒不如由我们把整条“流水线”搭起来。

既然Token已经是有量、能定价、有一定标准化趋势的商品形态，那我们完全可以利用自己的技术优势，向市场提供最高效的优质Token产能。

《中国企业家》：现在，你们最大的目标指引是不是Token？

夏立雪：是Token的生产效率和Token产生的价值，最典型的目标就是Token/秒。我们也在尝试用各种各样的方法，让Token/秒这个指标变得更好，所有的优化最后都可以回到这里。

算子优化直接提升了芯片上每秒产生的Token；稳定性优化、运维工作最后也都是为了提升Token/秒。

我们之所以使用各类异构芯片，也是为了让“Token/秒”的资源系数变得更大，让更多的芯片贡献到“Token/秒”中。一句话描述：让中国所有能被用起来的芯片，都能以最高的效率去产生Token，这就是我们当前最重要的目标。

我们也在投入一部分精力，帮助那些对Token还用得没有最高效，但有很好的创意和产品能力的中小创业者：他们可以用我们的工具把从Token到生产力的环节做好，让他们把百分百的精力，花在释放Token生产力，推出自己的产品上。

《中国企业家》：前段时间，你们还推出了一个龙虾盒子，打造企业级的Token工厂。龙虾盒子相较于市面上其他部署方案，在降低Token成本、提高产出效率方面解决了哪些痛点？

夏立雪：龙虾盒子是一种产品形式，目前还在早期阶段，我们更关注的是技术价值的内核。这个产品最重要的一点是，它反映了我们最终解决的是Token到生产力的转化效率。这涉及不同模型之间的配合，以及在不同数据域之间的安全性问题。

龙虾盒子最核心的卖点，聚焦于“每Token所释放生产力”的优化目标上。因为Token可以分层，一部分任务用最强的模型，另一部分任务用更具性价比的模型。盒子可以用来跑小模型，重点解决的是数据传输时的安全问题。

这件事既能用在终端的龙虾盒子上——它针对的痛点是数据不想上传到云端。未来也可以用在另一种场景——云上跑大模型，同时配合小集群，所以它更多代表我们在技术路线上的新布局和突破。

我们之前提过“异构、异域和异属”，一网三异。异构解决的是同一个集群中如果有两种不同的芯片，怎么一起跑。异域解决的是跨越一定距离（最远可达4000公里）的两个集群，怎么一起跑。异属解决的是两种不同数据区内的资源，怎么一起跑。龙虾盒子，也是这个技术路线的落地。

《中国企业家》：阿里、字节、腾讯都成立了Token的部门，你们内部团队会有这种专门的Token团队吗？

夏立雪：我在很早期提过一个概念，叫“模力资源部”，参照“人力资源部”的思路，因为未来AI就是人的扩展。目前，公司内部用AI写代码这件事，基本上已经是100%覆盖；我们也在用AI做运维；甚至内部还有帮大家用AI画PPT的工具。

现在有不少公司存在专门负责AI应用的部门，考核指标可能是公司和员工每天的Token使用量。虽然有点矫枉过正，最终不一定就是这种形态，但在早期完全可以先按这种方式跑起来。

《中国企业家》：你提到，过去每两周就会翻倍Token的使用量，那未来一年或者未来几年都会保持这个增长趋势吗？

夏立雪：调用量现在还是被供给卡住了。以后Token调用量增长，代表了用户对Token性价比的接受度，或者供给成本下降的速度。

未来3到6个月，大概率还会保持当前这样的供需状态；6个月后，可能会有一波新的Token用量爆发。这是因为供给能力有望大幅扩充：既包括新结构的国产芯片，也包括从模型到硬件的联合优化。此时，Token性价比和技术优化空间，也都会同步变大，这既让可用的资源增多，也让更精尖的芯片，有更高性价比的Token产出率。

就像之前的流量时代，用户从每个月花几百兆流量到用上几个G流量，但花的钱并没有增加10倍。Token用量增长，也带来了整个产业的繁荣，成本也会持续显著下降。

《中国企业家》：你们内部怎么评价Token的指标？是看使用量、看数量规模，看它的增速，还是看它带来的客户付费？哪个才是AI Infra公司价值的第一指标？

夏立雪：不同阶段指标肯定不一样。在快速增长的阶段，高价值Token用量的规模，是最重要的。同时，万亿参数模型大概率还是挺贵的，这代表Token和基础设施产生了对行业有价值、有回报的输出。

用量越大，能看到的优化空间越多；优化技术如果不错，就能产生更好的性价比，用量就会进一步增加，从而产生飞轮效应。

作为CEO，我更关注公司运转得好不好，看的是技术深度和客户认可度：能不能在技术主导的赛道保持最先进的领先地位，客户是不是认可我们的产品价值。外化的指标，是高价值模型的付费量或者调用量。

《中国企业家》：从你们平台上Token使用量的增速来看，主要来自哪些行业客户、哪些场景？智能体的贡献大概占比多少？

夏立雪：95%以上都是智能体产生的。所属行业也很丰富，其中写代码占大头，还有内容创意生成等。

中国将成为Token世界工厂

《中国企业家》：现在大家都在说Token涨价这件事情，你觉得Token应该涨价吗？或者你们觉得它应该怎么去定价？

夏立雪：多数国内模型的价格水平和涨幅都低于海外模型，但智能性已经不错了，所以涨价空间是有的。

更重要的是，涨价背后的逻辑是用户付费意愿——涨完之后还有人愿意买，这才是刚需。

涨价和成本降低这两件事叠加起来，是盈亏平衡线的移动，原本某些领域亏本的生意变成赚钱，紧接着就会进入供需增长飞轮，最终给用户带来实惠。

《中国企业家》：你会觉得长期来看Token会不会产能过剩，或者Token太多市场上消化不了，导致新一轮的价格战？会有这样一个拐点吗？

夏立雪：未来Token会分层。一层是更优质的、产生更大价值的Token，另一层可能是白热化竞争、追求极致性价比的Token。这很像互联网广告流量，最终都按CPM（千人成本）计费，大家了解哪些渠道的曝光更值钱。Token经济在这方面更明确，因为模型智能性水平，就体现在Token质量上。

我们作为Infra厂商看到的是，优质Token未来还是严重供不应求。全世界都这样，在中国，稀缺度其实更高。

《中国企业家》：3月底的时候，昆仑万维创始人周亚辉对我们说，移动互联网的CPM在十年间是涨的，获客成本越来越高，可能涨了10倍。在这个Token时代也可能是这样——Token的成本看起来越来越低，但可能价格也会相对应地涨10倍。

夏立雪：CPM涨，核心是因为广告投放平台推出了以ROI为目标的优化模型，能“保转化”。

Token也一样。未来定价可能按照模型类型分层，也可能按照Token的输入输出，甚至按SLA分层定价。但本质上都是为Token所产生的转化价值去分层。既然它转化为生产力的价值更高了，Token本身价值就更高，价格也可以更高。

《中国企业家》：你曾提到过，中国未来会成为世界的Token工厂——过去Made in China是制造业，现在是AI Made in China。

夏立雪：中国拥有丰沛的能源结构优势、完整的AI产业链和全球最大规模的AI应用市场，完全有能力复刻“Made in China”的成功路径。

以终为始，既然价值存在，所需要解决的就是方式、方法和链路的问题。

《中国企业家》：有些人说，电力就是算力、电力即Token。你会怎么评价这个观点？

夏立雪：未来在稳定的状态下，确实如此。比如芯片选型中，至少几家芯片厂商都有了可观的市场份额。此时意味着建设“Token工厂”，主要成本是原材料，而不是“房子”。

英伟达还是太贵了，相当于“房子”是拿金砖盖的，电的优化价值还没有完全凸显。但再过两年左右，“房子”的成本会变得可控，那时评价Token工厂的生产效率，看的一定是“原材料”到“成品”的转化效率。

因此，未来电的成本以及电到Token的转化率会变得更关键。中国在能源方面的优势，一定会在全球展现出巨大的行业价值。

新闻热线&投稿邮箱：tougao@iceo.com.cn

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.