据多方权威消息,DeepSeek将在春节前后发布V4。继续混合架构(自V3.2后一直如此),这意味着不会有R2了。定位旗舰型编程模型,专攻“生产级编程”,直接对标Claude。可一次性理解数万行代码,对企业级复杂项目更友好。训练过程首次引入了新架构mHC,大幅解决“灾难性遗忘”问题。即使小模型(据说10GB显存都可以配置),推理能力也翻了好几倍。同时,据可靠消息,智谱GLM-5、Kimi K2也大概率是在这个时间点发布。嚯,这下2026春节热闹了。加班,走起!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.