网易首页 > 网易号 > 正文 申请入驻

DeepSeek冲击波已经到达美股:全球技术团队争相“复现”R1

0
分享至

北京时间 1 月 28 日,美股收盘,英伟达下跌 16.86%,市值蒸发 5888.62 亿美元(约合人民币 4.27 万亿元),创下美股纪录。业界分析这与 DeepSeek 带来的冲击直接相关,该公司在训练明星产品 DeepSeek-V3 开源大模型的过程中,仅使用了 2,048 块 H800 显卡,这与英伟达与 OpenAI 们所讲的技术故事有所不同。

一位英伟达发言人在评价 DeepSeek 的成果时表示:“DeepSeek 是一个出色的 AI 技术进步,也是测试时间尺度(Test Time Scaling)的一个完美例子,”“DeepSeek 的工作说明了如何利用这一技术来创建新的模型。”当地时间 1 月 27 日,美国总统特朗普表示中国 AI 应用的突然兴起对于美国科技公司来说“应该是一个警钟”,但他同时表示仍对美国公司保持期望。

全世界技术圈还在以饱满的热情热议 DeepSeek,该公司也适时发布了一系列名为 Janus Pro 的基于视觉的多模态 AI 开源模型,并表示模型性能优于 OpenAI 的 DALL-E 3。

新模型是对去年底推出的 Janus 的升级。Janus Pro 通过升级训练流程、数据质量和模型大小对 Janus 进行了改进,从而提高了图像稳定性和细节丰富性。Janus-Pro 通过添加 7,200 万张高质量合成图像并将其与真实世界数据进行平衡,实现了更具视觉吸引力和更稳定的图像输出。

Janus Pro 系列模型参数的大小从 1B 到 7B 不等,参数较多的模型比参数较少的模型表现更好。目前,Janus Pro 已经获得了 MIT 协议许可,这意味着它可以在商业上不受限制地使用。

DeepSeek 将 Janus Pro 描述为“新颖的自回归框架”,它既能理解图片又能生成图片,兼具图像生成、视觉问答和图像字幕等功能。DeepSeek 表示,在 GenEval 和 DPG Bench 中两个 AI 评估基准,这一系列模型中参数最大的 Janus-Pro-7B 击败了 DALL-E 3 以及 PixArt alpha、Emu3-Gen 和 Stability AI 的 Stable Diffusion XL 等型号。

DeepSeek 在 Hugging Face 上的一篇文章中写道:“Janus Pro 的简单性、高度灵活性和有效性使其成为下一代统一多模式模型的有力候选者。”

要知道,只需一台普通电脑就能运行 Janus-Pro-7B,同时可以生成分辨率为 384x384 的图。网友“冷雨寻双”表示这就好比“用五菱宏光跑出了保时捷的加速度”。虽然图片的尺寸不算太大,但是考虑到其参数只有 7B,所以正如 DeepSeek 在上述文章中所写的:“Janus Pro 旨在实现性能和计算成本之间的平衡。”目前,在 Hugging Face 上,Janus-Pro 位居模型下载排行榜第二名,第一名则是 DeepSeek-R1。

通过发布 Janus Pro 7B,DeepSeek 将其范围从语言处理扩展到计算机视觉这一关键领域。由于 Janus Pro 7B 不需要大量的计算资源,因此可以大大降低希望将先进视觉 AI 集成到企业业务的门槛。无论是初创公司还是大型公司,都可以在不产生过高基础设施成本的情况下来部署先进的视觉智能模型。

与此同时,DeepSeek 的 APP 已经登上苹果应用商店排行榜榜首,超过了ChatGPT。不过,1 月 27 日,DeepSeek 表示其服务器遭到大规模恶意攻击,因此它暂停了注册。

因为最近一系列产品的良好表现,AMD 已宣布集成 DeepSeek-V3 到 MI300X GPU。许多技术团队也在尝试复现这一技术成果,来自美国加州大学伯克利分校、香港科技大学和 Hugging Face 的研究人员均已成功复现 DeepSeek 模型。这些研究人员发现仅仅使用强化学习,无需使用监督微调,仅用 30 美元就能见证“奇迹”。

比如,加州大学伯克利分校的研究人员在 CountDown 游戏中复现了 DeepSeek R1-Zero。他们证明只需使用强化学习,让参数仅有 3B 的基础语言模型也能实现自我验证和自我搜索。

香港科技大学的研究人员使用 8K 个样本,成功在 7B 模型上复现 DeepSeek-R1-Zero 和 DeepSeek-R1 的训练。具体来说,他们以 Qwen2.5-Math-7B 作为基础模型,通过对其进行强化学习,在不进行监督微调和没有使用奖励模型的情况下,让 Qwen2.5-Math-7B 在 AIME 基准上达到 33.3% 的准确率,在 AMC 上达到 62.5% 的准确率,在 MATH 上达到 77.2% 的准确率。

而 Hugging Face 则已官宣其复刻了 DeepSeek R1 的所有流程(pipeline),其从 DeepSeek-R1 中蒸馏出来高质量语料库,复现了 R1-Distill 模型。

总的来说,由 DeepSeek 引起的震撼还在持续。犹记得一年前的 2024 开年,人们都在关注 OpenAI 的 Sora。一年后的 2025 年开年,所有注意力都转移到 DeepSeek 身上,这似乎是“换了人间”。

编辑:李航

参考资料

https://futurism.com/silicon-valley-shambles-chinese-startup-deepseek

https://techcrunch.com/2025/01/27/viral-ai-company-deepseek-releases-new-image-model-family/

https://venturebeat.com/ai/deepseek-unleashes-janus-pro-7b-vision-model-amidst-ai-stock-bloodbath-igniting-fresh-fears-of-chinese-tech-dominance/

https://www.reuters.com/technology/artificial-intelligence/hedge-flow-hedge-funds-were-pausing-us-ai-bets-deepseek-emerged-says-goldman-2025-01-27/

https://www.reuters.com/technology/artificial-intelligence/what-is-deepseek-why-is-it-disrupting-ai-sector-2025-01-27/

https://www.reuters.com/technology/deepseeks-janus-pro-ai-model-beats-rivals-image-generation-2025-01-27/

https://www.reuters.com/technology/artificial-intelligence/chinese-ai-startup-deepseek-overtakes-chatgpt-apple-app-store-2025-01-27/

https://www.cnbc.com/2025/01/27/nvidia-calls-chinas-deepseek-r1-model-an-excellent-ai-advancement.html

https://www.nbcnews.com/tech/innovation/trump-china-deepseek-ai-wake-call-rcna189526

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
蒋介石晚年曾怒骂:我之所以会失去江山,罪魁祸首就是这两个人!

蒋介石晚年曾怒骂:我之所以会失去江山,罪魁祸首就是这两个人!

兴趣知识
2026-03-21 18:52:00
打到温特闭眼崩溃!孙颖莎三连决赛剑指3连冠:侯英超夸到词穷

打到温特闭眼崩溃!孙颖莎三连决赛剑指3连冠:侯英超夸到词穷

颜小白的篮球梦
2026-04-05 11:55:07
广东宏远VS山东男篮!杜锋冲击4连胜,萨林杰缺席,央视直播

广东宏远VS山东男篮!杜锋冲击4连胜,萨林杰缺席,央视直播

体坛瞎白话
2026-04-05 09:27:22
狐狸尾巴藏不住?李思思离开央视原因曝光,原来野心不止于此

狐狸尾巴藏不住?李思思离开央视原因曝光,原来野心不止于此

梦回千年aa
2026-04-04 12:36:56
睡前默念这5个字,百岁高僧开示:这是最简单的“修心聚能”法

睡前默念这5个字,百岁高僧开示:这是最简单的“修心聚能”法

温情邮局
2026-03-31 09:34:25
美国经过与伊朗的战争以后,大概率将会彻底打消与中国的武力冲突

美国经过与伊朗的战争以后,大概率将会彻底打消与中国的武力冲突

安安说
2026-03-29 13:41:15
出狱后的雷政富沧桑感袭面而来,前后对比引人唏嘘

出狱后的雷政富沧桑感袭面而来,前后对比引人唏嘘

霹雳炮
2026-03-14 22:49:47
局势180度反转,以色列袭击美国大使馆?特朗普沉默,英法德失声

局势180度反转,以色列袭击美国大使馆?特朗普沉默,英法德失声

天天热点见闻
2026-04-05 07:21:39
刘亦菲光脚丫白嫩干净

刘亦菲光脚丫白嫩干净

动物奇奇怪怪
2026-04-04 21:46:37
新冠后遗症的长期侵袭,无数人在不知不觉中深陷困境

新冠后遗症的长期侵袭,无数人在不知不觉中深陷困境

律法刑道
2026-04-01 10:15:47
脱离许家印后,原恒大歌舞团长白珊珊,最后居然嫁给了这个男人

脱离许家印后,原恒大歌舞团长白珊珊,最后居然嫁给了这个男人

兴史兴谈
2026-04-05 05:38:17
三缸机在葡萄牙拿了冠军,35%股份却没换来一张技术签字权。

三缸机在葡萄牙拿了冠军,35%股份却没换来一张技术签字权。

侃故事的阿庆
2026-04-05 14:37:12
清明前后,这8种蔬菜不要买?菜贩子的“真心话”到底该不该信

清明前后,这8种蔬菜不要买?菜贩子的“真心话”到底该不该信

江江食研社
2026-04-04 20:30:08
栾留伟勇救落水3孩童牺牲获评烈士,两年后市民在清明节自发向其雕像献花:你是我们的明星,永远不会忘记你

栾留伟勇救落水3孩童牺牲获评烈士,两年后市民在清明节自发向其雕像献花:你是我们的明星,永远不会忘记你

极目新闻
2026-04-05 12:52:37
王曼昱4-2申裕斌!王曼昱握拳庆祝,马琳双手指天,对手挺开心!

王曼昱4-2申裕斌!王曼昱握拳庆祝,马琳双手指天,对手挺开心!

篮球资讯达人
2026-04-05 13:24:57
2020年女子当众扇儿子耳光,儿子直接跳楼,如今女子已自杀身亡

2020年女子当众扇儿子耳光,儿子直接跳楼,如今女子已自杀身亡

观察鉴娱
2026-03-18 09:09:10
杨振宁去世5个月后,49岁翁帆现状:剪了头发染了色,仍独居国内

杨振宁去世5个月后,49岁翁帆现状:剪了头发染了色,仍独居国内

照见古今
2026-03-26 19:06:28
国内排名第一灭门案,一家五个孩子惨遭灭门,真凶竟然是他们!

国内排名第一灭门案,一家五个孩子惨遭灭门,真凶竟然是他们!

史记趣闻
2025-08-05 22:00:28
美国遮羞布被扯下马斯克:没有中国,谁也别想造出电动车!

美国遮羞布被扯下马斯克:没有中国,谁也别想造出电动车!

生活魔术专家
2026-04-04 18:35:14
内塔尼亚胡向法撒气后,不到24小时,卡尼表态,10国联手“施压”

内塔尼亚胡向法撒气后,不到24小时,卡尼表态,10国联手“施压”

泠泠说史
2026-04-02 14:24:09
2026-04-05 15:59:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16538文章数 514841关注度
往期回顾 全部

财经要闻

谁造出了优思益这头“怪物”?

头条要闻

伊朗称击落美C-130运输机 美国:我们自己炸的

头条要闻

伊朗称击落美C-130运输机 美国:我们自己炸的

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

好用心!宋慧乔为好友庆生做一桌美食

科技要闻

花200薅5千算力,Claude冷血断供“龙虾”

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

房产
本地
亲子
艺术
军事航空

房产要闻

小阳春全面启动!现房,才是这波行情里最稳的上车票

本地新闻

跟着歌声游安徽,听古村回响

亲子要闻

五个月宝宝非得玩钢琴

艺术要闻

21位中国当代名家的26幅油画

军事要闻

美飞行员获救细节:美伊发生激烈交火 至少4死1伤

无障碍浏览 进入关怀版