网易首页 > 网易号 > 正文 申请入驻

月之暗面K2.6背后:一个本科岗位暴露的战场转移

0
分享至

12小时不间断工作,4000多次工具调用,14个版本迭代——这不是某个硅谷极客的黑客马拉松,是Kimi K2.6的一次常规任务。而发布这款模型的公司,正在急招本科学历的推理平台工程师。

从X.0到X.6:版本号里的信号


月之暗面给K2.6的命名很有意思。这是杨植麟的第一个"X.6"版本。

在软件行业,X.0通常意味着架构级重构,X.5往往是重大功能更新,而X.6这种"小数点后一位"的迭代,按惯例不该掀起什么波澜。但K2.6的改动幅度,足够让同行重新理解什么叫"版本号通货膨胀"。

官方给出的几个数字:单个工程任务持续12小时,发起4000多次工具调用;Agent Swarm场景横向扩展到300个子agent、4000个协调步骤。

这些数字的潜台词是:K2.6不再是你问一句、它答一句的聊天工具。它开始真正"做事"了。

一个具体案例。月之暗面的工程师让K2.6在Mac上部署Qwen3.5-0.8B模型,并用一门极其小众的编程语言Zig优化推理性能。

12小时后,推理速度从15 tokens/秒提升到193 tokens/秒,比LM Studio还快20%。

关键不在于结果,在于过程:从来没有人教过K2.6怎么用Zig。都是它自己学的。

另一个案例更狠。K2.6接手exchange-core,一个有8年历史、已被优化到接近性能极限的开源金融撮合引擎。

13个小时,1000多次工具调用,4000多行代码修改。它分析CPU火焰图、定位内存瓶颈、重构线程拓扑,像一位经验丰富的系统架构师。

最终成果:中等吞吐量提升185%,性能吞吐量提升133%。

这不是"写代码",这是"做工程"。

四个能力方向的质变

K2.6的能力可以归纳为四个方向,但每一个都不是简单的"更强"——是工作模式的根本切换。

第一个方向:长周期自主编码。

以前的AI写代码是"一次性交付"。你给需求,它写完,结束。K2.6能持续工作十几个小时,自己读文件、跑测试、看报错、改代码、再测试,循环到任务完成。

它能跨语言泛化,Rust、Go、Python都没问题。它能处理不同领域的任务,前端、DevOps、性能优化都能覆盖。

企业测试的反馈很直接。Blackbox.ai说:「K2.6为开源模型树立了新标准,尤其是在长周期、agent风格的编码工作流中。」

Factory.ai的内部测试显示,K2.6比K2.5提升了15%,指令遵循更好,推理更彻底,编码错误更少。

第二个方向:端到端视觉设计。

你给K2.6一个简单的提示,比如"做一个科技公司的落地页",它不只是生成HTML和CSS。它会给你一个完整的前端界面:结构化布局、精心设计的首屏、交互组件、滚动触发的动画效果。

更关键的是,K2.6已经不满足于静态前端。它开始做简单的全栈应用,从用户认证到数据库操作,轻量级场景都能搞定。

月之暗面建立了内部的Kimi Design Bench,分为视觉输入任务、落地页构建、全栈应用开发、通用创意编程四个类别。K2.6在这些类别中的表现,已经可以和Google AI Studio掰手腕。

第三个方向:大规模Agent Swarm。

K2.5的Agent Swarm能协调100个子agent、执行1500个步骤,已经很强。K2.6直接扩大到300个子agent、4000个协调步骤。

这些agent在K2.6的调度下分工明确:有的广泛搜索,有的深度研究;有的分析大规模文档,有的负责长篇写作;有的生成文档,有的生成网站,有的生成幻灯片,有的生成电子表格。

它们不是各自为战,是形成一个整体。

第四个方向:技能提取与迁移。

你给K2.6上传一篇高质量的天体物理学论文,它能把这篇论文转化为一个"技能"——提取推理流程、可视化方法、写作风格。

然后基于这个技能,产出一篇40页、7000字的新论文,外加包含20000多条记录的数据集,以及14张天文级图表。

这不是摘要,是能力迁移。

从被动工具到主动agent

K2.6最本质的变化,是工作姿态的切换。

它不再是那种"只有你发了指令才会行动"的工具。它开始主动工作了。

月之暗面的强化学习基础设施团队做了一个实验:让K2.6支持的agent自主运行5天,负责监控、事件响应、系统操作。

结果是从告警到解决,全程自己搞定,不需要人工介入。

在OpenClaw和Hermes Agent这类持久化agent平台上,K2.6能跨多个应用程序持续运行,7×24小时执行任务,主动管理日程、执行代码、协调跨平台操作。

月之暗面建立了内部的Claw Bench,覆盖编码任务、即时通讯生态系统集成、信息研究与分析、定时任务管理、内存利用五个领域。在所有指标上,K2.6的任务完成率和工具调用准确性都显著优于K2.5。

基准测试的评分更能说明问题。

HLE-Full(带工具)得分54.0,超过GPT-5.4的52.1和Claude Opus 4.6的53.0。DeepSearchQA的F1分数92.5,准确率83.0。SWE-Bench Pro得分58.6,SWE-Bench Verified达到80.2。

这些数字背后,是agent从"能跑"到"好用"的临界点。

那个"本科"岗位暴露的战场转移

就在K2.6发布前几天,月之暗面开始急招Kimi Code平台推理工程师。

学历要求:本科。补充说明,招聘页面写的"7年经验"是发起者打错了,实际为"3年"。

这不是孤立事件。3月份招Coding agent工程师时,月之暗面打出的是"不限学历"。

要知道,这是一家博士密度极高、论文产出如流水的头部AI公司。杨植麟本人是清华+卡内基梅隆的博士,核心团队几乎全员顶会论文作者。

为什么突然降低学历门槛?

答案藏在岗位描述里。这个岗位的核心业务,是为agent搭建稳定、可观测、成本可控的模型调用基础设施。

具体来说:在模型和应用之间建一套调度系统,让几十上百次的模型调用能稳定跑起来,成本可控,出问题能查。

这需要三类能力,没有一个是博士学位能直接兑换的。

第一,网关与路由的工程经验。

agent调用模型时不是直接访问API,而是通过网关统一管理。网关负责请求分发、协议转换、认证鉴权,还要处理不同模型提供商的接口差异。月之暗面已有K系列模型,但Kimi Code这类平台仍需要多provider适配。

第二,成本意识与模型选型能力。

不是所有任务都需要最强模型。简单的代码补全用轻量模型就够了,复杂的架构设计才需要重模型。路由系统要根据任务类型、上下文长度、响应速度要求,自动选择合适的模型,避免"高射炮打蚊子"。

这需要你了解不同模型的特性,知道它们完成不同任务的成本分别是多少,也需要实时的性能监控和动态调整。

第三,对推理成本的深度理解。

推理模型的token消耗是普通模型的数倍。OpenAI的o1系列,它的reasoning_tokens(推理token)可能达到输出token的几十倍。没有精细的成本控制,agent跑一天就能烧掉一个团队的季度预算。

这些能力从哪里来?不是顶会论文,是生产环境的踩坑经验。

为什么偏偏是郭达雅

时间线很有意思。

3月份,郭达雅从DeepSeek离职。4月份,加入字节跳动。他最擅长的正是agent和代码智能。

月之暗面急招的这个岗位,干的活和郭达雅的研究方向高度重合。但月之暗面没有挖他——或者说,挖不动。

这暴露了一个更深层的问题:当AI竞争的主战场从实验室的算法创新,转移到代码智能和agent的生产环境工程落地时,人才结构的缺口比技术缺口更难补。

算法天才可以用论文和开源项目证明自己。但能让agent稳定跑12小时、4000次调用的工程师,需要的是在真实业务里摔打过、被凌晨三点的事故叫起来过、算过每一分钱成本的人。

这种人,学历筛选不出来。

月之暗面想要的,是一个完整的agent生态。但生态的底座不是模型参数,是工程师手里的网关、路由、限流、日志和成本表。

行业层面的信号

K2.6的发布和那个"本科"岗位,应该放在一起看。

它们指向同一个趋势:大模型公司正在经历从"科研驱动"到"工程驱动"的转型。

2023年到2024年初,行业比拼的是模型规模、训练算力、论文数量。2024年下半年开始,比拼的是谁能把模型变成可靠的生产工具。

这个转变的代价是,原来的核心资产——顶尖算法人才——正在部分贬值。不是说他们不重要,是说光有这个不够了。

Agent要落地,需要三类人:懂模型的算法工程师、懂系统的工程工程师、懂业务的场景工程师。后两类人,学历门槛可以很低,经验门槛极高。

月之暗面的招聘策略调整,是对这个现实的承认。

另一个信号是技术路线的收敛。K2.6的四个能力方向——长周期编码、视觉设计、Agent Swarm、技能迁移——和OpenAI的Codex、Claude的Computer Use、Google的Deep Research,正在指向同一个终局:agent作为通用计算接口。

区别在于,有的公司在堆功能,有的公司在建基础设施。

K2.6的12小时持续运行、4000次工具调用,背后是月之暗面在强化学习基础设施上的投入。那个急招的推理平台工程师岗位,是要把这种能力产品化、规模化。

杨植麟的真正挑战

回到标题的问题:杨植麟真的需要一个郭达雅吗?

答案是:需要,但不止一个。

郭达雅代表的是一类人才——能把agent从demo变成产品的工程领导者。但月之暗面缺的不是某个具体的人,是一套完整的工程文化和组织架构。

博士密度高的公司有个通病:容易低估工程复杂度,容易把"能跑"当成"能用",容易在论文里解决问题而不是在用户场景里解决问题。

K2.6的表现证明月之暗面的技术实力。但那个"本科"岗位的存在,证明他们意识到了自己的短板。

Agent的竞争进入下半场。上半场的赢家是模型能力最强的公司,下半场的赢家可能是工程落地最快的公司。

月之暗面正在试图同时赢两场。K2.6是技术筹码,急招工程人才是组织筹码。

但筹码要变成胜负手,还需要时间。agent的稳定性和成本控制能力,不是招几个人就能解决的,需要整个产品体系的重新设计。

杨植麟的赌注是:在竞争对手完成工程转型之前,用K2.6的技术优势抢占开发者心智。

这个窗口期有多长?取决于OpenAI、Anthropic、Google的工程化速度,也取决于月之暗面自己能把那个"本科"岗位背后的基础设施建到什么程度。

当模型公司开始从论文、榜单、聊天框走向自动写代码、自动调用工具、自动完成任务时,瓶颈不再只是算法。也可能是凌晨三点,某个工程师收到的告警短信。

月之暗面能不能在工程层面跑通agent的规模化落地?那个"不限学历"的招聘启事,是焦虑的开始,还是转型的起点?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
牛肉顶多注个水猪肉顶多催个肥,唯有三文鱼全程cosplay

牛肉顶多注个水猪肉顶多催个肥,唯有三文鱼全程cosplay

富贵说
2026-04-14 23:15:09
记者在横店见到他时,他在角落吃凉透的盒饭

记者在横店见到他时,他在角落吃凉透的盒饭

澎湃新闻
2026-04-15 11:31:12
外交部:敦促美方恪守国际法原则和国际关系基本准则,立即停止以任何方式插手香港事务和中国内政

外交部:敦促美方恪守国际法原则和国际关系基本准则,立即停止以任何方式插手香港事务和中国内政

环球网资讯
2026-04-21 15:51:17
1972年威海打捞英潜艇,拆解后严格保密,39年后卡梅伦指中方窃密

1972年威海打捞英潜艇,拆解后严格保密,39年后卡梅伦指中方窃密

磊子讲史
2026-03-28 14:02:08
俄罗斯梁赞州向各单位下达征兵命令,翻译成中文很亲切

俄罗斯梁赞州向各单位下达征兵命令,翻译成中文很亲切

李未熟擒话2
2026-04-20 10:47:19
八村垒:不管杜兰特是否复出,湖人都必须要击败火箭

八村垒:不管杜兰特是否复出,湖人都必须要击败火箭

懂球帝
2026-04-21 14:47:06
存储器涨价,工信部将出手

存储器涨价,工信部将出手

小蜜情感说
2026-04-21 17:23:54
中超最新积分榜:两队7轮不败,扣分球队首进前5,2队积分转正

中超最新积分榜:两队7轮不败,扣分球队首进前5,2队积分转正

中超伪球迷
2026-04-21 22:07:04
切记,半夜醒来千万不要看时间!

切记,半夜醒来千万不要看时间!

环球网资讯
2026-04-16 07:56:25
王毅将访问柬埔寨、泰国、缅甸并与董军共同出席中柬外长、防长“2+2”战略对话机制首次会议

王毅将访问柬埔寨、泰国、缅甸并与董军共同出席中柬外长、防长“2+2”战略对话机制首次会议

界面新闻
2026-04-21 15:11:33
我退伍后去女战友家里开的工厂应聘,她红着脸说:你娶我好吗?

我退伍后去女战友家里开的工厂应聘,她红着脸说:你娶我好吗?

千秋文化
2026-04-18 19:07:07
伊朗议会要员:伊朗已决定继续与美国进行谈判

伊朗议会要员:伊朗已决定继续与美国进行谈判

新京报
2026-04-20 15:37:11
2026教师改革:1800万人的教师的身份都变了

2026教师改革:1800万人的教师的身份都变了

猫叔东山再起
2026-04-20 09:05:09
突传大利好,要谈成了?

突传大利好,要谈成了?

隔壁老投
2026-04-21 14:39:35
武汉三镇2-0浙江,赛后评分:武汉三镇10号排第一

武汉三镇2-0浙江,赛后评分:武汉三镇10号排第一

侧身凌空斩
2026-04-21 21:36:54
女子酒窝大被网友质疑是AI特效 本人:是真的 一直都被人说大

女子酒窝大被网友质疑是AI特效 本人:是真的 一直都被人说大

快科技
2026-04-20 16:40:42
国乒世界冠军宣布退网:给我多少钱也不回来了 复出不是为了流量

国乒世界冠军宣布退网:给我多少钱也不回来了 复出不是为了流量

念洲
2026-04-21 06:49:10
你喝的白酒只有七百年历史,三千年酒文化跟它半毛钱关系都没有

你喝的白酒只有七百年历史,三千年酒文化跟它半毛钱关系都没有

富贵说
2026-03-31 23:21:39
歼-10C现身伊朗,巴空军三次出手未能击败F-16

歼-10C现身伊朗,巴空军三次出手未能击败F-16

晓焎科普
2026-04-21 03:45:11
我没有退休金,搭伙老伴每月给我存8000元,13年后老伴儿子找到我

我没有退休金,搭伙老伴每月给我存8000元,13年后老伴儿子找到我

第四思维
2025-07-08 13:22:18
2026-04-22 02:40:49
摸鱼算法
摸鱼算法
致力于用最前沿的AI技术,换取更多发呆时间的三十岁青年。
1584文章数 16关注度
往期回顾 全部

科技要闻

创造4万亿帝国、访华20次,库克留下了什么

头条要闻

三国取消飞航许可 赖清德无法窜访斯威士兰

头条要闻

三国取消飞航许可 赖清德无法窜访斯威士兰

体育要闻

一到NBA季后赛,四届DPOY就成了主角

娱乐要闻

宋承炫晒宝宝B超照,宣布老婆怀孕

财经要闻

现实是最大的荒诞:千亿平台的冲突始末

汽车要闻

全新坦克700正式上市 售价42.8万-50.8万元

态度原创

房产
健康
本地
公开课
军事航空

房产要闻

年薪40-50万!海南地产圈还在猛招人

干细胞抗衰4大误区,90%的人都中招

本地新闻

春色满城关不住|白鹃梅浪漫盛放,吴山藏了一片四月雪

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普公开对伊开战真正原因

无障碍浏览 进入关怀版