网易首页 > 网易号 > 正文 申请入驻

DeepSeek下周将发布V4多模态模型

0
分享至

2月28日消息,据金融时报报道,DeepSeek 将于下周发布其最新的大型语言模型,距离其上次重大版本发布已超过一年,这再次考验了中国在人工智能领域挑战美国竞争对手的雄心。

据两位知情人士透露,位于杭州的DeepSeek实验室计划发布V4模型,这是一款具备图片、视频和文本生成功能的多模态模型。

他们表示,DeepSeek已与中国人工智能芯片制造商华为和寒武纪合作,针对这两家公司的最新产品对V4模型进行优化。

这将是DeepSeek自2025年1月发布R1推理模型以来推出的首个重要模型。

该公司声称,其构建的系统仅需极少的计算能力,即可媲美硅谷领先的人工智能模型。

这一举动震动了美国科技股,一些专家将其描述为人造卫星时刻,标志着中国作为人工智能强国的迅速崛起。

此后,DeepSeek 发布的都是渐进式更新,而不是全新的模型,这使得阿里巴巴和 Moonshot 等国内竞争对手能够抢占市场对低成本开源中国模型的需求。

DeepSeek 致力于优化 V4 模型以适配中国制造的芯片,此举有望提振中国市场对其半导体产品的需求,并加速推理(即利用训练好的模型生成响应)领域从美国芯片制造商英伟达和 AMD 向中国市场的转型。

路透社率先报道了 DeepSeek 与华为和寒武纪的合作。

据另一位知情人士透露,DeepSeek 并未与英伟达合作,为其产品优化模型。

英伟达继续主导着训练芯片市场,尤其是在计算密集型的预训练阶段,模型需要在此阶段吸收海量数据。

去年发布的R1版本附带了一份详细的技术报告,阐述了DeepSeek如何更高效地利用Nvidia芯片来训练和运行其模型。

DeepSeek因分享其开发推理模型的训练方法而备受赞誉,这使得其他实验室能够研究并应用他们的发现。推理模型旨在通过将复杂问题分解成更小的步骤来解决这些问题。

据一位直接了解相关计划的人士透露,DeepSeek 预计将于下周发布 V4 版本的同时发布一份篇幅较短的技术说明,并在大约一个月后发布一份更全面的报告。

本周早些时候,Anthropic 指责 DeepSeek和其他两家中国人工智能实验室对其模型进行蒸馏攻击,这种做法是利用更高级系统的输出训练较小的模型,从而使它们能够在不使用相同计算资源的情况下复制这家美国公司的性能。

相关公司均未回应置评请求。(鞭牛士、AI普瑞斯编译)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“清华学霸”李一诺:27岁博士毕业,4年生3个娃,替世界首富花钱

“清华学霸”李一诺:27岁博士毕业,4年生3个娃,替世界首富花钱

北有南栀
2026-02-28 17:55:03
上海电影院现场捉奸,女主照片曝光,最刺痛的一幕其实不是打架

上海电影院现场捉奸,女主照片曝光,最刺痛的一幕其实不是打架

半糖甜而不腻
2026-02-28 10:58:19
前线首次拍到乌克兰幻影2000,“铁锤”数量大涨!俄军又炸水坝

前线首次拍到乌克兰幻影2000,“铁锤”数量大涨!俄军又炸水坝

鹰眼Defence
2026-02-28 17:01:01
油价最新分析:或出现历史性飙升

油价最新分析:或出现历史性飙升

上观新闻
2026-03-01 06:50:08
960万拆迁款全给弟弟,父亲70大寿姐姐没去,寿宴当天弟弟懵了

960万拆迁款全给弟弟,父亲70大寿姐姐没去,寿宴当天弟弟懵了

晓艾故事汇
2025-08-04 08:08:52
伊朗:科威特美国海军基地所有基础设施被摧毁,大量美军伤亡;一艘美国运送弹药的战舰被袭后发生爆炸

伊朗:科威特美国海军基地所有基础设施被摧毁,大量美军伤亡;一艘美国运送弹药的战舰被袭后发生爆炸

极目新闻
2026-03-01 07:40:29
杭州灵隐寺,为何要保留“一代妖僧”的雕像?看到千万不要乱拜

杭州灵隐寺,为何要保留“一代妖僧”的雕像?看到千万不要乱拜

收藏大视界
2026-02-28 23:03:27
中国四位最“不靠谱”专家,“忽悠”央视28年,为何还能爆火至今

中国四位最“不靠谱”专家,“忽悠”央视28年,为何还能爆火至今

小莜读史
2026-02-27 20:30:12
美以袭击伊朗,华人紧急逃离德黑兰:没想到袭击来得这么快,连夜买机票离开但领空已关闭,街头发生爆炸已断网

美以袭击伊朗,华人紧急逃离德黑兰:没想到袭击来得这么快,连夜买机票离开但领空已关闭,街头发生爆炸已断网

极目新闻
2026-02-28 17:13:18
泪目!21岁少年的最后成全:停药救母,把遗憾藏进未赴的海边之约

泪目!21岁少年的最后成全:停药救母,把遗憾藏进未赴的海边之约

行者聊官
2026-02-28 16:06:40
男篮世预赛晋级形势分析!中国队1战定生死:韩国或被联手踢出局

男篮世预赛晋级形势分析!中国队1战定生死:韩国或被联手踢出局

篮球快餐车
2026-03-01 00:42:22
男篮世预赛又曝出一大冷门!3冠王惨遭掀翻:中国队苦主彻底陨落

男篮世预赛又曝出一大冷门!3冠王惨遭掀翻:中国队苦主彻底陨落

篮球快餐车
2026-02-28 11:36:43
价格战再次打响!问界“降”7万,零跑4.6万!

价格战再次打响!问界“降”7万,零跑4.6万!

电动知家
2026-02-28 19:59:59
很可惜,白象的基本盘危险了

很可惜,白象的基本盘危险了

首席品牌评论
2026-02-28 13:55:53
汪小菲吐槽小汪宝心眼太多,回应玥箖上学问题,筱梅或成了导火索

汪小菲吐槽小汪宝心眼太多,回应玥箖上学问题,筱梅或成了导火索

查尔菲的笔记
2026-02-28 13:39:27
年销7900辆,巨亏223亿欧:意大利的汽车工业已然输掉了全部未来

年销7900辆,巨亏223亿欧:意大利的汽车工业已然输掉了全部未来

电科技网
2026-02-28 19:48:45
53岁李冰冰在巴黎杀疯了!白到发光隐现腹肌,这状态真不是人类?

53岁李冰冰在巴黎杀疯了!白到发光隐现腹肌,这状态真不是人类?

草莓解说体育
2026-02-06 05:59:56
美国媒体:中国突破禁令的方式简单粗暴,日本将助中国科技腾飞

美国媒体:中国突破禁令的方式简单粗暴,日本将助中国科技腾飞

蜉蝣说
2026-01-09 14:37:07
浙江省纪委省监委网站:林世南,主动投案

浙江省纪委省监委网站:林世南,主动投案

浙江之声
2026-02-27 20:27:04
火箭爆冷输热火,还内讧!杜兰特砍历史第5神迹,一战看清3个现实

火箭爆冷输热火,还内讧!杜兰特砍历史第5神迹,一战看清3个现实

毒舌NBA
2026-03-01 07:22:35
2026-03-01 09:35:00
鞭牛士 incentive-icons
鞭牛士
准确、快速、有深度的科技媒体
104253文章数 61692关注度
往期回顾 全部

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

头条要闻

特朗普称哈梅内伊身亡 后者去年6月布局完整继承体系

头条要闻

特朗普称哈梅内伊身亡 后者去年6月布局完整继承体系

体育要闻

球队主力全报销?顶风摆烂演都不演了

娱乐要闻

周杰伦儿子正面照曝光,与父亲好像

财经要闻

冲突爆发 市场变天?

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

教育
房产
健康
公开课
军事航空

教育要闻

专业排名百分比揭秘!别再理解错了

房产要闻

滨江九小也来了!集齐海侨北+哈罗、寰岛...江东教育要炸了!

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美国以色列联合袭击伊朗 实时战况

无障碍浏览 进入关怀版