GPT 5.6 发布之时:GPT-5.6来了,强到没边,但普通人还摸不到
DeepSeek 开源了 DSpark,给 DeepSeek-V4 Flash / Pro 装上了一套推理加速引擎,开启涡轮增压模式
它的核心思路是“先打草稿,再让大模型验稿”:小模型先一次性预测多个 token,大模型再批量验证,通过的直接输出,从而大幅减少等待时间
DSpark 更厉害的地方在于,它不只是粗暴加速,而是用半自回归生成提升草稿质量,再用置信度调度判断哪些 token 值得验证,把 GPU 算力用在最有效的位置
官方数据显示,在真实线上流量中,DSpark 可让 V4-Flash 单用户生成速度提升 60%-85%,V4-Pro 提升 57%-78%。同时它还适配 Qwen、Gemma 等其他模型,说明这不是 DeepSeek 自用的小技巧,而是一套可扩展的开源推理加速方案
老章预测,目前开源的一众模型,或许很快就会有 DSpark 版本,尤其是我喜爱的 Qwen3.6 27B 和 35B ,蛮期待[让我看看]
![]()
![]()
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.