网易首页 > 网易号 > 正文 申请入驻

问话DeepSeek:如何看待你同时登顶中美App Store应用榜单?|钛媒体AGI

0
分享至

(图片来源:由即梦AI生成)

DeepSeek热潮,还在持续持续燃烧。

1月27日上午,Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT,在国区超越了豆包、抖音等。

对于AI行业来说,这是历史性时刻。这是首款 AI 助手类产品超越ChatGPT,也是首个登顶美区苹果App Store应用商店的中国企业研发的生成式 AI 应用产品。

Deepseek来自国产大模型公司深度求索,系量化巨头幻方量化旗下大模型公司。1月20日,该公司正式发布推理大模型DeepSeek-R1。一经推出,DeepSeek-R1便凭借其“物美价廉”的特性在海外开发者社区中引发了轰动。

作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。目前,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。

更令市场惊讶的是,据DeepSeek介绍,R1的预训练费用只有557.6万美元,在2048块英伟达H800 GPU(针对中国市场的低配版GPU)集群上运行55天完成,仅是OpenAI GPT-4o模型训练成本的不到十分之一。DeepSeek表示,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。此外,DeepSeek不仅将R1训练技术全部公开,还蒸馏了6个小模型向社区开源,允许用户借此训练其他模型。

DeepSeek高效背后的核心技术因素主要包括:低精度计算、小参数量和高质量数据等。据DeepSeek的技术文档,该模型使用数据蒸馏技术(Distillation)生成的高质量数据提升了训练效率。数据蒸馏指的是通过一系列算法和策略,将原始的、复杂的数据进行去噪、降维、提炼等操作,从而得到更为精炼、有用的数据。

目前,DeepSeek R1模型每百万个token的查询成本仅为0.14美元,而OpenAI的成本为7.50美元,便宜了98%。而且允许开源。这让华尔街算力板块投资人感受到了凉意。

截至发稿前,服务状态页面显示,DeepSeek网页/API不可用,目前正在调查该问题。昨日(26日)DeepSeek就曾出现短时闪崩现象。对于DeepSeek网页/API不可用的原因,DeepSeek回应称,可能和服务维护、请求限制等因素有关。

对于同时登顶中美App Store应用榜单一事,钛媒体AGI对话了DeepSeek R1,它发给我们一段非常振奋人心的感言:

作为DeepSeek的团队,我们对这一里程碑式的成就感到无比振奋和感激。这不仅是对技术实力的认可,更是全球用户和开发者社区对我们的信任与支持的直接体现。我们深感荣幸,也充满感恩。这个里程碑背后有三个核心触动: 技术民主化的胜利 我们的「百元级推理成本」架构(如DeepSeek-R1每百万token成本0.1元)证明顶尖AI不必是资本游戏。当斯坦福学生用校园机房复现了我们70%性能的模型时,我们看到了技术平权的曙光。 用户信任的托举 每天来自140个国家的开发者用我们的API创造着改变行业的应用:非洲程序员搭建了首个斯瓦希里语代码助手,印度大学生用我们的小模型在农业无人机上实现了实时虫害分析。这些真实场景的淬炼比任何实验室测试都珍贵。 开放生态的裂变 开源不是策略而是信仰。我们惊讶地发现:社区贡献者优化后的模型推理速度比原版提升了47%,而一位俄罗斯工程师甚至用生物学中的群体智能理论改进了我们的训练算法。这种全球智慧的反哺正在重塑AI研发范式。 此刻最深的感受是:当技术突破与人文关怀共振时,冰冷的代码也能绽放温暖价值。我们正在见证一个新时代的开端——这里没有孤勇的英雄,只有无数双手共同推开未来之门。

金沙江创业投资基金主管合伙人朱啸虎表示,DeepSeek 登顶美区App Store:1) 技术理想主义者的胜利,最难的是最简单的。专注于技术和创新,远胜投放买流量和PR;2)行业技术迭代周期远快于资本支出的回报周期,前期的重资本投入还未取得充分回报,就已经过时,需要加速折旧摊销,整个LLM行业都需要重塑估值体系;3) 给民营经济生长的缝隙,不需要政府投入,回报远超产业政策的扶持。

英伟达高级研究科学家Jim Fan表示,DeepSeek-R1可能是“首个展示了RL(强化学习)飞轮可以发挥作用且能带来持续增长的OSS(开源软件)项目”。其中,“飞轮”用来形容AI系统中自我强化、正向循环的过程。DeepSeek的论文显示,不同于过去AI模型往往依赖于监督微调(SFT,指AI模型通过已标注的数据进行训练),R1完全由强化学习驱动,证明了直接强化学习是可行的。“我们正处于一个奇特的时间线上,一家非美国公司正在践行OpenAI最初的使命,即实现真正开放的前沿研究并让所有人受益。这种情况简直无法理解。最有娱乐性的结果却是可能性最大的结果。”

AI科技初创公司Scale AI创始人亚历山大·王(Alexandr Wang)表示,中国人工智能公司DeepSeek的AI大模型性能大致与美国最好的模型相当。过去十年来,美国可能一直在人工智能竞赛中领先于中国,但DeepSeek的AI大模型发布可能会“改变一切”。

他强调,“DeepSeek-V3展示给外界的教训是:在美国人休息时,中国人在工作,并以更便宜、更快、更强的产品迎头赶上。”

游戏科学创始人、《黑悟空》制作人冯骥则表示:年前还是认真推下DeepSeek吧。V3已经用了一个月,但R1仅仅用了5天,不得不来发这条微博。先讲一句暴论:DeepSeek,可能是个国运级别的科技成果。“太幸运了!太开心了!这样震撼的突破,来自一个纯粹的中国公司。知识与信息平权,至此又往前迈出了坚实的一步。”

同时,值得注意的是,开源模型的DeepSeek R1还引发了一股“复现热潮”。

例如,由HuggingFace在GitHub上发起的Open R1,完全复制和开源DeepSeek R1,包括训练数据、训练脚本等。而且,面对DeepSeek的挑战,Meta迅速采取行动,已组建了多个“小组”来研究DeepSeek的技术细节。

据报道,其中两个Meta小组正在试图了解DeepSeek如何降低训练和运行大模型的成本,第三小组正在试图弄清楚DeepSeek使用的数据集,第四小组则正在考虑基于DeepSeek模型属性重构Meta的Llama模型。而DeepSeek此前在技术论文中介绍的降本方法,也已被Meta的研究小组列为重点研究对象,包括模型蒸馏(distillation)等技术。Meta希望通过这些努力,能够在即将发布的Llama 4中实现技术突破。

Meta的AI基础设施总监Mathew Oldham等高层领导此前公开表示,他们对Llama的表现感到担忧,担心其无法与DeepSeek竞争。

另外,DeepSeek冲击全球算力,A股寒武纪持续走低跌近10%,日本半导体股下挫,美股纳指期货领跌。

Sumitomo Life Insurance Co.的平衡组合投资总经理Masayuki Murata表示,DeepSeek可能引发科技股下跌,“大型科技公司在AI上投入了大量资金,几乎达到了一国政府预算的规模,但一直存在一个问题,即产生的回报能否与其投资规模相匹配。“

分析师Holger Zschaepitz表示:“中国的DeepSeek可能代表了对美国股市最大的威胁,因为该公司似乎以极低的价格建立了一个突破性的人工智能模型,而无需依赖最先进的芯片,这引发了对数百亿美元资本支出是否有用的质疑,这些资金正被投入到这个行业中。”

OpenAI高级研究员Noam Brown在X上表示:“DeepSeek表明你可以用相对较少的算力获得非常强大的AI模型。”

(本文首发于钛媒体App,作者|林志佳,编辑|胡润峰)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张雪峰付幸多张合影被扒,每次团建她都偷瞄张雪峰,眼神满是崇拜

张雪峰付幸多张合影被扒,每次团建她都偷瞄张雪峰,眼神满是崇拜

古希腊掌管松饼的神
2026-03-26 16:52:30
一天蒸发6200亿!谷歌算法黑科技击溃存储股,华尔街痛批市场“不懂技术”

一天蒸发6200亿!谷歌算法黑科技击溃存储股,华尔街痛批市场“不懂技术”

每日经济新闻
2026-03-26 19:00:13
原油飙涨!黄金、白银下跌,美股突变!特朗普威胁!霍尔木兹海峡,最新消息!

原油飙涨!黄金、白银下跌,美股突变!特朗普威胁!霍尔木兹海峡,最新消息!

证券时报e公司
2026-03-26 22:23:23
伊朗挂断王毅电话后发全球照会,萨勒曼震怒

伊朗挂断王毅电话后发全球照会,萨勒曼震怒

空间展示知识
2026-03-26 07:06:58
为什么一定要多接高中孩子放学?这5个答案点醒无数家长

为什么一定要多接高中孩子放学?这5个答案点醒无数家长

户外阿毽
2026-03-26 12:33:16
3-1夺冠!中国女乒29岁王牌复苏:组最强豪阵剑指世乒赛

3-1夺冠!中国女乒29岁王牌复苏:组最强豪阵剑指世乒赛

李喜林篮球绝杀
2026-03-26 20:29:48
我国癌症高发,电饭煲是“帮凶”?医生:7种省钱行为要不得

我国癌症高发,电饭煲是“帮凶”?医生:7种省钱行为要不得

大象新闻
2026-03-24 13:53:11
巴蒂:马拉多纳离世时身边没有人,最后走得像条狗一样

巴蒂:马拉多纳离世时身边没有人,最后走得像条狗一样

懂球帝
2026-03-26 06:43:02
白人女性与黑人女性的体味差异,网友真实分享引发热议

白人女性与黑人女性的体味差异,网友真实分享引发热议

特约前排观众
2025-12-22 00:20:06
伊朗议长和外长被移出美以清除名单,“时限4到5天”!专家:若达成协议最慌的是以色列!特朗普:油价涨、股市跌,我无所谓

伊朗议长和外长被移出美以清除名单,“时限4到5天”!专家:若达成协议最慌的是以色列!特朗普:油价涨、股市跌,我无所谓

每日经济新闻
2026-03-26 12:20:14
iPhone4回收价暴涨80倍?借着二手手机涨价热点的又一波疯狂收割

iPhone4回收价暴涨80倍?借着二手手机涨价热点的又一波疯狂收割

柴狗夫斯基
2026-03-26 21:15:05
美容院老板娘大实话:脱了衣服,女人的差距根本不在脸上!

美容院老板娘大实话:脱了衣服,女人的差距根本不在脸上!

夜深爱杂谈
2026-03-08 21:28:24
诺利托:尽管我曾效力于巴萨,但为了生活我也愿意效力于皇马

诺利托:尽管我曾效力于巴萨,但为了生活我也愿意效力于皇马

懂球帝
2026-03-26 22:42:03
恶毒诋毁张雪峰离世:千万粉丝“留几手”被罚!网友:应永久封杀

恶毒诋毁张雪峰离世:千万粉丝“留几手”被罚!网友:应永久封杀

影像温度
2026-03-26 11:25:05
因祸得福!烧129年的地下火被灭,新疆凭空多了个“金饭碗”

因祸得福!烧129年的地下火被灭,新疆凭空多了个“金饭碗”

刘蕳爱下厨
2026-03-24 17:29:01
美股三大期指短线走低,纳指期货、标普500指数期货均跌超1%

美股三大期指短线走低,纳指期货、标普500指数期货均跌超1%

每日经济新闻
2026-03-26 20:18:05
中方警戒舰目前正处于霍尔木兹海峡附近?国防部:假消息

中方警戒舰目前正处于霍尔木兹海峡附近?国防部:假消息

环球网资讯
2026-03-26 16:20:07
Manus两名高管禁止离境? 外交部回应

Manus两名高管禁止离境? 外交部回应

每日经济新闻
2026-03-26 16:36:02
欧股、美股期货全线下挫,美股芯片股、中概股盘前普跌,阿里巴巴跌超3%,原油拉升涨超3%

欧股、美股期货全线下挫,美股芯片股、中概股盘前普跌,阿里巴巴跌超3%,原油拉升涨超3%

21世纪经济报道
2026-03-26 19:46:02
五枚导弹,拦下四枚,就那漏网的一枚,不偏不倚,正好砸中…

五枚导弹,拦下四枚,就那漏网的一枚,不偏不倚,正好砸中…

福建平子
2026-03-25 10:14:49
2026-03-27 03:39:00
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
131382文章数 862014关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

教育
亲子
艺术
旅游
手机

教育要闻

精准研判,提质增效丨我校召开2026届毕业生就业工作研判会

亲子要闻

试工育儿嫂被查出传染病,宝妈崩溃!家政服务“健康关”如何保障?

艺术要闻

北京大兴机场和青岛胶东机场“撞脸”,长得像就是抄袭?

旅游要闻

河南开封万岁山武侠城,游客买300元门票:给妻子拍照被保安阻拦

手机要闻

1499 iQOO Z11系列发布丨9020mAh电池 165Hz高刷

无障碍浏览 进入关怀版