网传Kimi K3 计划在 Q3 发布,参数规模超过 2.5 万亿;内部实验已测试远超 100 万 token 的上下文长度,但最终是否向用户开放 1M 上下文仍不确定。爆料还称,当前限制 Kimi 推出 1M 上下文的主要瓶颈不是技术,而是算力资源。
这条传闻的背景是 DeepSeek V4 Flash / Pro 已把 1M 上下文作为公开卖点,抬高了开源权重模型的长上下文门槛。Kimi 目前公开版本 K2.6 的上下文窗口仍为 256K,如果 K3 真把 1M 上下文推向公开版本,Moonshot 将在模型规模和长上下文能力上同时追 DeepSeek V4。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.