网易首页 > 网易号 > 正文 申请入驻

1.6万亿参数模型推理成本砍到27%,这家公司刚拿了260亿估值

0
分享至

有个变量正在让独立AI实验室的估值逻辑重写。Cognition刚完成260亿美元估值的D轮融资,融了10亿,而8个月前C轮时它还只值100亿。直接涨了2.5倍。

这背后的叙事只有一个——编程是个无上限的可触达市场。ARR数据也撑住了这个判断:预期年底年化营收破10亿美元。如果你去画Cognition的增长曲线,会发现它和“2025年到底发生了什么”那组疯狂图表长得几乎一模一样。这不是巧合。


企业级SaaS的ARR永远是使用量的滞后指标。Cognition现在拿下的客户logo也很有意思,都是企业圈子和创业生态里最难啃、最挑剔的那批客户,包括上周刚报道过的Exa和Modal。这类客户愿意付费,本身就说明产品已经跨过了从玩具到工具的那条线。

关于推理效率这条线,这几天推特上讨论密度很高。核心结论是:推理优化现在拼的是架构,不是算子。EAGLE 3.1这次迭代的重点是推测解码的稳健性,通过稳定隐藏状态反馈和降低深层次解码步骤里的注意力漂移,专门针对长上下文的接受长度和实际服务可靠性做了强化。这个团队特别提到了和vLLM、TorchSpec的合作。

内核和系统层也有进展。Perplexity开源了一个重建的Unigram分词器,CPU占用砍了五六倍,514个token跑进63微秒,零堆内存分配。Qwen3.5在TokenSpeed上据报达到了580 token/s,专跑智能体工作负载,背后是阿里巴巴、LightSeek、NVIDIA、Mooncake和FlashAttention-4贡献者的联合优化。支持层也在跟上,MaxSim v2加了反向传播,H200上比原生PyTorch快10.33倍,A100上快11.94倍。

更有意思的是降价逻辑。中国几个实验室最近的API降价是可持续的,因为它们反映的是每个token服务成本的实打实下降,不是短期补贴。一位观察者拆解了DeepSeek V4-Pro的架构:混合注意力机制配合压缩稀疏注意力和重度压缩注意力,把百万token的KV缓存压缩到V3.2的大约10%,单token推理浮点运算降到27%,同时在1.6万亿总参数里只路由490亿活跃参数。

小米MiMo走的是另一条路,用滑动窗口注意力加快分层级缓存管理来降低缓存流量。核心贡献者直接确认了深层输入缓存命中价格下降的来源:缓存token容量提升5倍,缓存成本约降80%,架构上的全注意力与滑动窗口注意力稀疏比做到了1:7。整体的图景已经很清楚了——长上下文推理的经济账,现在被注意力设计、缓存层级和路由机制联合推动,不再只是堆更便宜的硬件。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“超人”也逃不过衰老?亨利·卡维尔最新近照曝光

“超人”也逃不过衰老?亨利·卡维尔最新近照曝光

粉红冻奶的观影日记
2026-05-29 16:04:00
苹果五款新品曝光,6 月 9 日正式发布!

苹果五款新品曝光,6 月 9 日正式发布!

XCiOS俱乐部
2026-05-30 20:40:52
生了4个儿子,因太穷送出两个,谁知四个儿子后来都成了亿万富翁

生了4个儿子,因太穷送出两个,谁知四个儿子后来都成了亿万富翁

兴趣知识
2026-05-30 18:51:30
为什么印度就算顶着50℃高温,也要抵制中国空调?

为什么印度就算顶着50℃高温,也要抵制中国空调?

周哥一影视
2026-05-30 20:33:39
真要退出?曝怀特塞德缺席剩余总决赛,名记给出原因,G3或见分晓

真要退出?曝怀特塞德缺席剩余总决赛,名记给出原因,G3或见分晓

萌兰聊个球
2026-05-30 11:27:36
187比58,参议院压倒性票数通过,高市早苗成功集国家大权于一身

187比58,参议院压倒性票数通过,高市早苗成功集国家大权于一身

小小科普员
2026-05-29 16:10:40
克林斯曼展望美加墨世界杯:我预计一些知名球星会早早回家

克林斯曼展望美加墨世界杯:我预计一些知名球星会早早回家

懂球帝
2026-05-30 22:27:12
别再低估瑞士了!他们有机会成为本届世界杯最恐怖的黑马

别再低估瑞士了!他们有机会成为本届世界杯最恐怖的黑马

郭夷包工头
2026-05-30 22:36:46
奚梦瑶何猷君补办婚礼的真相!

奚梦瑶何猷君补办婚礼的真相!

八卦疯叔
2026-05-30 10:01:40
西决抢七裁判阵容:马克·戴维斯主裁 曾吹罚G3雷霆大胜马刺

西决抢七裁判阵容:马克·戴维斯主裁 曾吹罚G3雷霆大胜马刺

醉卧浮生
2026-05-30 21:24:16
因遭“死亡恐吓” 190元榴莲被“仅退款”商家报警并获刑事立案

因遭“死亡恐吓” 190元榴莲被“仅退款”商家报警并获刑事立案

封面新闻
2026-05-30 17:42:05
马刺4900万从骑士挖人?文班亲自召唤!哈登降薪留队打满20个赛季

马刺4900万从骑士挖人?文班亲自召唤!哈登降薪留队打满20个赛季

野渡舟山人
2026-05-30 19:56:55
绿媒造谣大反转?美智库主席致歉郑丽文:愚蠢的民进党消息来源

绿媒造谣大反转?美智库主席致歉郑丽文:愚蠢的民进党消息来源

郭茂辰海峡传真
2026-05-30 22:12:17
景甜与好友聚会被拍,状态轻松素颜笑容甜美,与男友矛盾尚未解决

景甜与好友聚会被拍,状态轻松素颜笑容甜美,与男友矛盾尚未解决

花哥扒娱乐
2026-05-30 22:19:55
诺基亚刚上架的199元新机,可能是来捣乱的

诺基亚刚上架的199元新机,可能是来捣乱的

刘奔跑
2026-05-29 23:57:55
普京:若获得客观数据,俄方将调查罗马尼亚无人机事件

普京:若获得客观数据,俄方将调查罗马尼亚无人机事件

澎湃新闻
2026-05-30 00:56:50
跨区收麦师傅一句话火了:河南老乡递来的东西,牛奶能收,麦芽果汁千万别碰!

跨区收麦师傅一句话火了:河南老乡递来的东西,牛奶能收,麦芽果汁千万别碰!

爱下厨的阿椅
2026-05-30 19:26:28
日本实施史上最大规模外汇干预行动

日本实施史上最大规模外汇干预行动

参考消息
2026-05-30 21:21:08
利物浦官方:斯洛特率队拿到联赛第20冠在队史上占有一席之地

利物浦官方:斯洛特率队拿到联赛第20冠在队史上占有一席之地

懂球帝
2026-05-30 22:27:11
某金融央企总部的食堂餐食,很不错啊。

某金融央企总部的食堂餐食,很不错啊。

微微热评
2026-05-29 12:26:00
2026-05-30 23:00:49
闪存猎手
闪存猎手
全网蹲好价的野生捕手,算力与羊毛都不可辜负。
4125文章数 37关注度
往期回顾 全部

科技要闻

车圈大佬发声:价格战远去,但竞争仍残酷

头条要闻

媒体:美防长香会演讲对台湾只字不提 有明确政治意图

头条要闻

媒体:美防长香会演讲对台湾只字不提 有明确政治意图

体育要闻

岁月不饶人!39岁德约鏖战近5小时拼到呕吐

娱乐要闻

张碧晨《歌手》 “活人微死” 自嘲

财经要闻

双汇管不住一头猪

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

教育
本地
旅游
手机
公开课

教育要闻

有变!高考考生最多四个考场!@2026山东考场新规

本地新闻

用剪纸的方式,打开江苏扬州

旅游要闻

外籍游客在浙江一景区水源地洗澡?涉事景区辟谣:照片非景区,闭园已超一年

手机要闻

REDMI K90至尊版入网?K90单品激活破200万

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版