DeepSeek V4 的细节,正在陆续浮出水面。
科技账号 Legit 率先披露,V4 的轻量版本代号为「sealion-lite(海狮轻量版)」,目前已在至少一家推理服务商处展开内测,相关方均签署了严格的保密协议。
据悉,该版本支持 100 万 token 上下文窗口,原生具备多模态能力,性能明显优于现有网页及应用端模型。另有用户同期展示了 V4 生成的 SVG 样本,直言效果相当亮眼。
在参数疑似泄露的同期,今天凌晨,路透社援引知情人士消息称,DeepSeek 计划最快于下周发布 DeepSeek V4。
结合此前南华早报透露的消息,DeepSeek 下一代旗舰模型预计将是一款万亿参数级别的基础模型。且正是由于模型规模大幅增长,训练速度明显放缓,导致发布时间被推迟。
但路透社报道中还提到,在发布 V4 之前,DeepSeek 并未按行业惯例向英伟达、AMD 等美国芯片厂商提供模型预览,转而提前数周向包括华为在内的中国芯片供应商开放访问权限,以便完成适配和优化工作。
截至发稿前,英伟达与 AMD 均拒绝置评,DeepSeek 和华为亦未作出回应。
网友本周也发现,DeepSeek 的 GitHub 仓库迎来密集更新,大量积压的 PR 被集中合并处理。
此次更新主要集中在与 DeepSeek API 集成相关的代码库,内容涵盖 AI 客户端应用、开发运维工具及企业级解决方案等第三方集成项目,更像是工程师节后返工的例行整理。
从 Hugging Face 上超过 7500 万次的累计下载量来看,DeepSeek 依然是全球开源 AI 领域最受瞩目的存在之一。
这只「海狮」究竟何时正式亮相,所有人都在翘首以待。
![]()
![]()
![]()
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.