【太平洋科技快讯】4月30日消息,DeepSeek 在 AI 开源社区 Hugging Face 发布了其最新数学推理模型——DeepSeek-Prover-V2-671B。该模型参数量高达 6710 亿,从命名推测,这可能是对去年发布的 Prover-V1.5 模型的重大升级。
DeepSeek-Prover-V2-671B 基于混合专家(MoE)架构,并采用 Lean 4 框架进行形式化推理训练。该模型结合了强化学习和大规模合成数据,显著提升了自动化证明能力。此外,新模型支持 BF16、FP8 和 F32 等多种计算精度,并采用高效的 safetensors 文件格式,使得训练和部署更加快速且节省资源。
该模型的发布也可能为 DeepSeek 的 R2 系统铺路,进一步验证其在复杂推理任务中的能力。同时,它也为 AI 在数学领域的应用提供了新的可能性,例如加速数学知识的发现和验证。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.