月之暗面kimi正式合上多模态“拼图”。1月27日,月之暗面Kimi发布并开源Kimi K2.5模型,并称之为Kimi迄今为止最智能的模型,该模型除了在长文本上展示了优势,也在Agent、代码、图像、视频及一系列通用智能任务上取得一定的表现。目前,Kimi K2.5模型及相关功能已在Kimi官网上新。
月之暗面创始人、CEO杨植麟亲自发视频为该模型站台。他提到,“K2.5是我们目前最强大的模型,它是一个全能模型,不管是视觉还是文本,对话还是Agent,思考还是非思考——所有这些能力,都集中在这一个模型里。我们不仅想让kimi学会写代码,更希望它具备设计审美,它能做出像专业设计师出品一样有高级审美和动效的网页,同时K2.5通过视觉能力把编程的门槛真正降了下来。”
![]()
在降低编程门槛这一点上,Kimi K2.5的具体实现路径是,通过“看”用户上传的视频自动拆解背后的交互逻辑。比如,在官方案例中,你只需要录制一段网页操作的视频并发送给Kimi k2.5,它就能理解网页的UI布局、交互方式,最后直接生成网页的底层干净、专业的代码,并把网页从头到尾复现出来。
![]()
在Agent能力上,Kimi K2.5发布了Agent 集群,面对复杂任务,K2.5能根据任务需求调度多达100个分身,并行处理1500个步骤。比如,给Kimi Agent集群投喂40篇关于心理学和AI的论文。Kimi会自主按顺序把这40篇论文通读一遍,以此确保上下文完整保留了所有必要信息。紧接着会衍生出几个子Agent分别负责不同章节撰写。最后,主Agent会负责把关验收,将所有内容汇总生成了一份长达几十页的专业PDF综述。
![]()
在近期的达沃斯世界经济论坛2026年年会上,月之暗面Kimi总裁张予彤预判,随着AI推理成本在过去一年下降99%至99.9%,“智能”将成为一种新的通用语言,未来的软件将走向“无形化”。在她的构想中,人类无需再通过点击按钮、背诵公式来操作GUI(图形用户界面),而是通过自然语言,由智能体(Agent)调用各类功能。
“软件不会消失,但它将变得随手可得且‘可丢弃’。”张予彤预测,未来的代码创作将进入“氛围编程”(vibe coding)阶段,只要用户意图清晰,AI就能即时生成个性化工具并交付结果。
采写:南都N视频记者 林文琪
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.