网易首页 > 网易号 > 正文 申请入驻

月之暗面黄震昕:Kimi不做重交付,FDE难点不在于模型厂商

0
分享至


今年以来,当头部的大模型厂商在围绕模型迭代、产品力、融资、上市等集体抢占时间窗口时,商业化这个命题也被悄然塞进了他们的时间表里。

结合近期Kimi对外的披露,以及与月之暗面Kimi B端负责人黄震昕的交流,可以梳理出这家公司在商业化路径上的一系列战略选择与自我定位。

在过去两年间,Kimi首次大规模应用二阶优化器Muon取代了已成为行业标准10年之久的Adam优化器,推出基于KDA注意力机制的Kimi Linear架构,以及推出注意力残差方案,对计算效率得以大幅提升。

关于Harness,Kimi的判断是:随着基础模型变强,对外部复杂Harness的要求会降低,类似去年Prompt工程热度的下降。因此Kimi内部已开始实践Loop Engineering(循环工程)。

黄震昕认为,随着Token市场价格走高,用户对于高性能的Token需求仍有支付意愿,同时,虽然由于芯片荒和算力成本上升导致成本在涨,但模型厂商也在通过技术优化,将Token的实际成本往下降低。

在定价策略上,Kimi的定位是做高性能模型,而非最便宜的模型。尤其是伴随今年模型价格的集体上涨,背后核心原因仍然是全球算力供应跟不上Token需求增长。为此,Kimi对冲成本压力的方式是通过技术优化,其KV-Cache命中率达到90%以上。

“评估模型价格不能只看输入输出定价,还要看KV-Cache命中率。只要命中,成本就会降很多,能给用户节省成本。” 黄震昕告诉笔者。

作为Kimi B端负责人,黄震昕还着重提及了Kimi在To B业务的布局,包括三层服务体系:模型层提供K2.7 Code、K2.6等基础模型;架构层提供API及Agent SDK;产品层推出企业版,包含Kimi Agent集群、Kimi Code、Kimi Work等工具。黄震昕指出,Kimi不会做太重的交付工作,“模型本身还有大量技术难题待攻克,Kimi能把模型做好已经非常不易。”

对于企业级应用所需的“最后一公里”服务,Kimi选择通过FDE合作伙伴来完成端到端交付,而非自建重服务团队。在行业解决方案层面,Kimi也在尝试与亚马逊云科技等合作构建金融、医疗、制造等垂直场景的方案,前者提供模型能力,而后者主要提供行业经验与客户资源。

以下是黄震昕在亚马逊云科技中国峰会上的演讲全文。

我是月之暗面(Moonshot AI)的黄震昕,负责公司的B端业务。很高兴能在亚马逊云科技中国峰会上和大家分享我们的思考。

我加入月之暗面时,就被一个愿景所吸引:致力于寻找将能源转化为智能的最优解。为什么选择这个命题?人类历史上有三次真正的能源变迁。第一次是我们学会了利用阳光,第二次是我们发掘了煤炭,第三次,也就是现在,我们正在学习如何将能源高效地转化为智能。前两次转化是线性的、有限的,而这一次转化是可逆的、可扩展的、可存储的。

关于实现这一最优解,我们的目标一直是做出全球领先的模型。因此,对于月之暗面来说,扩大模型规模(Scaling)是一个必选项。大家从新闻中也了解到,我们近期完成了规模不小的融资,但和海外同行相比,这笔资金并不算多。因此,我们致力于找到效率的最优解。

为此,我们选择了三个技术方向,因为它们对应了智能体的三个核心能力维度:聪明程度、干活时长(Long Context)和协作能力(Agent Swarm)。

第一,聪明程度。数据并非无限,在相同的算力下,谁能学得更聪明,谁就更具优势。

第二,干活时长。这决定了模型如何能处理更长时间的任务,同时不忘记最初的目标是什么。

第三,协作能力。单个智能体再强大,也有其局限性。如何让多个智能体有效组队,协作完成复杂的用户任务,是另一个关键。

这三个维度结合起来,就是AI产品能力的整体体现。自2025年以来,我们在这三个方向上都取得了关键突破。大家可以看到,Kimi的每一项创新,都瞄准了最基础的模型架构,而不仅仅是工程效率的优化。

以优化器为例,经典的Adam优化器诞生于11年前,我们将一种新的优化技术运用到了大部分训练中,使实际数据的使用效率提升了27%,整体效率直接翻倍。在长文本(Long Context)方面,传统的Attention架构诞生于八年前,我们推出了Kimi Linear Attention技术,将在下一代模型中应用。传统架构下,模型扩大十倍,训练和推理成本将扩大一百倍;而采用新技术后,仅需十倍的算力即可实现。此外,残差连接技术诞生于十年前,我们推出了注意力残差(Attention Residual)技术,使效率提升了25%。

马斯克也曾专门为我们的技术点赞。可以说,模型的规模瓶颈正在被我们逐一解决,更大规模、更高质量的模型成为可能。一个行业常识是,KV缓存命中率很大程度上影响用户的最终使用成本。我们通过研发Kimi的工程优化,持续提升效率,降低KV缓存失效率,从而降低了API的使用成本,让更多用户能够用得起。

最近,我们也发布了Kimi K2.7,其代码能力大幅提升。我们还特别推出了高速版本,输出速度达到了180 token/秒。很多朋友反馈,用上之后就再也回不去了。这也是我们努力通过推理优化提升客户体验的例证。

Kimi是一家注重审美的公司,我们的品牌调性很明确,专注于生产力领域。我们把有限的能源和算力,集中在学术研究、软件工程、复杂推理等领域。长期使用的用户会发现,我们的核心场景始终围绕着提升生产力。

大家可能对Kimi的印象更多停留在To C端,但其实我们在To B领域也并非简单地售卖API,而是提供了一整套完整的生产力赋能体系。该体系具备三层能力:

模型层:Kimi持续做最强的基础模型。目前底座已涵盖K2.7 Code、K2.6和K2.5等模型,为企业级应用提供坚实的智能底座。

服务层:Kimi提供丰富的API,开发者可以借此进行深度集成,将Kimi的能力无缝嵌入到企业自身的工作流中,例如网页搜索、PPT生成等。

工具/产品层:Kimi提供包括Kimi Agent集群、Kimi Code、Kimi Claw、Kimi Work等开箱即用的产品。该层级直接解决企业真实场景中的复杂问题,例如让Agent自动处理报表、生成行业分析、管理项目文档等。

在全球化业务拓展方面,Kimi正携手亚马逊云科技推进全球业务协同,借助其从基础设施层到应用落地层面的全方位助力,实现全球化规模加速,为全球企业赋能生产力:

基础设施和服务层面:Kimi运行在亚马逊云科技遍布全球的数据中心和网络基础设施上,获得了稳定可靠的算力支持,确保模型运行得又快又稳。Kimi多个模型现已登陆Amazon SageMaker,让更多开发者可以进行模型的训练与推理,大幅降低使用门槛。同时,Amazon Bedrock已经接入了Kimi K2.5等开源模型,未来Kimi正在积极推进接入更多最新模型,让用户无需自行管理基础设施或单独部署服务器就能使用Kimi模型。此外,Amazon Bedrock Guardrails的企业级安全能力也将自动适用于Kimi,提供有害内容过滤、提示词攻击防护以及企业合规保障。

业务合作层面:Kimi已登陆亚马逊云科技Marketplace,直接触达全球数百万活跃企业客户。全球客户可以通过该数字软件市场简化采购流程,实现一键使用、按量付费与零门槛接入。同时,借助APN合作伙伴网络,Kimi正在快速拓展企业客户。

垂直行业层面:Kimi与亚马逊云科技联合打造行业解决方案,已覆盖金融、医疗、制造等垂直行业场景。在合作中,Kimi提供核心大模型,亚马逊云科技发挥其丰富的行业经验与客户资源,共同将Kimi的能力无缝嵌入到企业的真实业务流程中。

以上就是今天的分享。我们期待与亚马逊云科技携手,继续探索将能源转化为智能的最优解。

(作者 | 杨丽,编辑 | 杨林)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
悲情?荷兰近3届世界杯均在点球战被淘汰出局!92年12次参赛仍0冠

悲情?荷兰近3届世界杯均在点球战被淘汰出局!92年12次参赛仍0冠

我爱英超
2026-06-30 11:58:50
6名渔民被扣10天不放,大陆四大反制直接砸过去:这次不忍了

6名渔民被扣10天不放,大陆四大反制直接砸过去:这次不忍了

面包夹知识
2026-06-29 14:32:06
“美帝”没救成欧洲,美的救了!美的空调绕开3国法律,巨头懵了

“美帝”没救成欧洲,美的救了!美的空调绕开3国法律,巨头懵了

墨兰史书
2026-06-30 20:30:03
震惊!韩红基金会捐救护车,给富足的北京急救中心,被网友追问

震惊!韩红基金会捐救护车,给富足的北京急救中心,被网友追问

火山詩话
2026-06-30 16:59:06
日媒:日本队1-2憾负巴西后,田中碧遭社媒网暴!

日媒:日本队1-2憾负巴西后,田中碧遭社媒网暴!

随波荡漾的漂流瓶
2026-06-30 16:50:01
山东泰山,极不体面

山东泰山,极不体面

吴女士
2026-06-30 15:54:51
女子怀孕后,丈夫和情夫都争抢孩子,2012年丈夫杀死情夫

女子怀孕后,丈夫和情夫都争抢孩子,2012年丈夫杀死情夫

汉史趣闻
2026-06-30 17:51:05
乌克兰迈出危险一步,拿中国核心利益去换援助,中方是时候反击了

乌克兰迈出危险一步,拿中国核心利益去换援助,中方是时候反击了

策前论
2026-06-30 13:51:02
退休干部夫妻工资2万孩子留美,因病不能做家务申请困难补助!

退休干部夫妻工资2万孩子留美,因病不能做家务申请困难补助!

兵叔评说
2026-06-30 21:03:25
巴拉圭淘汰德国后,巴拉圭知名女球迷里克尔梅直播中动情落泪

巴拉圭淘汰德国后,巴拉圭知名女球迷里克尔梅直播中动情落泪

懂球帝
2026-06-30 11:32:05
突传噩耗!陈翔六点半“妹爷”去世,享年82岁,最后露面瘦脱相

突传噩耗!陈翔六点半“妹爷”去世,享年82岁,最后露面瘦脱相

叨唠
2026-06-30 20:23:25
中国空调“爆卖”欧洲:市场受欢迎程度超预期,中欧班列紧急补货

中国空调“爆卖”欧洲:市场受欢迎程度超预期,中欧班列紧急补货

经济观察报
2026-06-30 17:43:32
韩红“走个面”翻出旧账:《天路》《青藏高原》,她一直不是原唱

韩红“走个面”翻出旧账:《天路》《青藏高原》,她一直不是原唱

李晚书
2026-06-30 19:35:02
保时捷女销冠再获2026年上半年销冠,本人回应:虽然累,但从未经历倦怠期,希望冲刺全球销量排名

保时捷女销冠再获2026年上半年销冠,本人回应:虽然累,但从未经历倦怠期,希望冲刺全球销量排名

极目新闻
2026-06-30 15:19:55
韩国球迷抗议,让中国承担他们世界杯费用,是中国国足坑了他们

韩国球迷抗议,让中国承担他们世界杯费用,是中国国足坑了他们

安珈使者啊
2026-06-30 14:18:04
原地解散!德国世界杯16强出局,全队返程下机时情绪低落,球队将于周二召开发布会,球员可自由离队

原地解散!德国世界杯16强出局,全队返程下机时情绪低落,球队将于周二召开发布会,球员可自由离队

大风新闻
2026-06-30 19:28:07
48小时内!高市开始反击:召见中国大使后,日本又爆发一个噩耗

48小时内!高市开始反击:召见中国大使后,日本又爆发一个噩耗

羽逸地之光
2026-06-30 17:15:53
审计署抽查60县,平均每个县翻出10个亿问题资金

审计署抽查60县,平均每个县翻出10个亿问题资金

风向观察
2026-06-30 10:44:34
德媒:格雷茨卡拒绝主罚点球,踢丢关键点球的塔此前从未罚过点

德媒:格雷茨卡拒绝主罚点球,踢丢关键点球的塔此前从未罚过点

懂球帝
2026-06-30 21:10:30
华东理工大学机械与动力工程学院原副院长安琦逝世,享年63岁

华东理工大学机械与动力工程学院原副院长安琦逝世,享年63岁

澎湃新闻
2026-06-30 09:34:26
2026-06-30 23:32:49
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
135890文章数 862358关注度
往期回顾 全部

科技要闻

iPhone18 Pro遭泄密!印度代工商惹祸

头条要闻

坎贝尔承认:中国是最成功渡过难关的国家

头条要闻

坎贝尔承认:中国是最成功渡过难关的国家

体育要闻

大热倒灶压力给到法国 王楚揭法国队隐患

娱乐要闻

韩红称要退出公益,多位名人挽留

财经要闻

万亿“寒王”,历史时刻

汽车要闻

奇瑞风云A9探店 五个理由一定来看看

态度原创

时尚
本地
房产
旅游
军事航空

“复古波点”又流行回来了!夏天简单穿就很时髦

本地新闻

贵州小城的新目标:举办“村超”世界杯!

房产要闻

等了三年!改善顶流实景交付,海口标杆的的答卷来了!

旅游要闻

“跟着诗词游四川”正式启动 六城联袂邀约:从剑门雄关一路“游”到嘉陵碧波

军事要闻

以色列防长:穆杰塔巴已被列入死亡名单

无障碍浏览 进入关怀版