4月30日消息,五一假期前夕,DeepSeek低调开源了新模型——DeepSeek-Prover-V2-671B。该模型参数量达6710亿,支持多种计算精度格式,包括BF16、FP8和F32。
据介绍,该模型采用更高效的Safetensors文件格式,提升了加载速度和存储安全性。目前尚未同步发布模型卡和技术报告。
从命名来看,新模型或为2024年8月推出的数学推理模型Prover-V1.5的升级版本。V1.5当时被优化用于处理复杂的数学定理论证任务。(袁宁)
4月30日消息,五一假期前夕,DeepSeek低调开源了新模型——DeepSeek-Prover-V2-671B。该模型参数量达6710亿,支持多种计算精度格式,包括BF16、FP8和F32。
据介绍,该模型采用更高效的Safetensors文件格式,提升了加载速度和存储安全性。目前尚未同步发布模型卡和技术报告。
从命名来看,新模型或为2024年8月推出的数学推理模型Prover-V1.5的升级版本。V1.5当时被优化用于处理复杂的数学定理论证任务。(袁宁)