网易首页 > 网易号 > 正文 申请入驻

DeepSeek登顶下载榜:冯骥、朱啸虎力荐AI界拼多多

0
分享至

就在刚过去的周末,国产AI大模型DeepSeek反超ChatGPT,一举登顶美区苹果应用商店免费App排行第一,引发硅谷关注。 在国内各大社交媒体上,DeepSeek更是引起了广泛讨论,“中国AI大模型震动华尔街”“全球掀DeepSeek复现狂潮”“DeepSeek登顶美区苹果下载榜”等等话题迅速冲上热门。另外,《黑神话:悟空》制作人冯骥、金沙江创投朱啸虎也纷纷下场推荐DeepSeek。

对标OpenAI o1,用更少的卡训练出效果差不多的模型

就在1月20日,DeepSeek刚发布了性能对标OpenAI o1 正式版的R1大模型,并同步开源模型权重。据悉,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

值得一提的是,在模型训练费用昂贵的当下,DeepSeek仅仅花费了560万美元训练R1模型,但该模型在很多AI基准测试中已经达到甚至超越OpenAI o1模型。另外,不少开发者尝试复现 DeepSeek-R1。比如,伯克利 AI 研究所在读博士潘家怡(Jiayi Pan)就遵照 DeepSeek R1-Zero的算法复现,结果只用了不到30美元的计算成本,就让其项目中的模型拥有了自我验证和探索的能力。

牛津大学博士、百度前高级科学家吴俊德在社交媒体上表示,DeepSeek在海外已被吹上天了,其认为行业贡献而言:GPT>deepseek>gemini>llama及其他。谈及DeepSeek引起关注的原因,吴俊德表示,“很多人的着眼点在于DeepSeek用很少的卡也能训练出效果差不多的模型,但这是结果,更重要的是DeepSeek这次证明了纯粹的outcome reward Rl能够直接把模型提到o1水平,在他出来之前,业内所有人都认为需要prm(process reward model)才能做到这点,这已经是颠覆行业的发现。”

吴俊德还提到,这意味着,“用更少的卡训练出效果差不多的模型”可能不仅仅是节约成本这么简单,更是一种新的进化方式,意味着在这种方法往上堆更多的卡有可能把模型能力再往上提升一个数量级,甚至直接达到AGI(通用人工智能)。

《黑神话:悟空》制作人:“可能是个国运级别的科技成果”

1月26日晚,游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥也发了一篇长微博推荐DeepSeek。他表示,DeepSeek V3已经用了一个月,但R1仅仅用了5天,不得不来发这条微博。“先讲一句暴论:DeepSeek可能是个国运级别的科技成果”。

冯骥打了个比方说,如果有一个AI大模型做到了以下的任何一条,都是超级了不起的突破。“一是强大到比肩O1的推理能力,暂时没有之一;二是便宜,参数少,训练开销与使用费用小了一个数量级;三是开源。任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的mini模型;四是免费,目前提供的服务完全免费,任何人随时随地可用;五是联网,暂时唯一支持联网搜索的推理模型(o1还不支持);六是本土,深度求索是一家很小规模的年轻中国公司,由没有海外经历甚至没有资深从业经验的本土团队开发完成。”

金沙江创业投资基金主管合伙人朱啸虎也在社交媒体上表示,“DeepSeek登顶美区App Store,是技术理想主义者的胜利,最难的是最简单的。专注于技术和创新,远胜投放买流量和PR;二是行业技术迭代周期远快于资本支出的回报周期,前期的重资本投入还未取得充分回报,就已经过时,需要加速折旧摊销,整个LLM行业都需要重塑估值体系;另外给民营经济生长的缝隙,不需要政府投入,回报远超产业政策的扶持。”

公开资料显示,DeepSeek是幻方量化旗下的AI公司,创立于2023年,幻方量化创始人梁文峰在量化投资和高性能计算领域有深厚背景,毕业于浙江大学电子工程系人工智能方向的。DeepSeek一直走开源、性价比路线,一直被冠以“AI界拼多多”的名号,至今还没融过资。

去年5月,DeepSeek发布DeepSeek-V2,价格是GPT-4-Turbo的近百分之一,“AI界拼多多”瞬间声名鹊起。去年12月,DeepSeek还发布了大模型DeepSeek-V3,因该模型“2048个GPU、2个月、近600万美元”的极低训练预算受到关注。

采写:南都记者 林文琪

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
来俊臣的酷刑有多狠?曾有女犯哀求:只要不上刑,杀全族都行

来俊臣的酷刑有多狠?曾有女犯哀求:只要不上刑,杀全族都行

铭记历史呀
2026-03-09 15:28:19
克林顿:我一生对两件事倍感遗憾,一中国加入WTO,二我做错了

克林顿:我一生对两件事倍感遗憾,一中国加入WTO,二我做错了

近史谈
2026-03-24 19:08:48
迟迟都等不到中企复工,巴拿马头号帮手已介入,中方加强港口管制

迟迟都等不到中企复工,巴拿马头号帮手已介入,中方加强港口管制

阿凫爱吐槽
2026-03-25 15:24:29
匈牙利的“通俄门”代价很大:防泄密,欧盟把匈排除在敏感谈判外

匈牙利的“通俄门”代价很大:防泄密,欧盟把匈排除在敏感谈判外

深析古今
2026-03-25 05:54:08
霓虹暗黑界车大灯天花板:十位现役丰腴女老师,她们究竟有何魅力

霓虹暗黑界车大灯天花板:十位现役丰腴女老师,她们究竟有何魅力

碧波万览
2026-03-26 05:40:03
战场奇迹!1台乌军机器人死守阵地45天硬刚俄军冲杀和机枪扫射

战场奇迹!1台乌军机器人死守阵地45天硬刚俄军冲杀和机枪扫射

子桑说
2026-03-25 17:27:05
这是清朝格格们的真实容貌,都看看吧,这不是演员扮演的

这是清朝格格们的真实容貌,都看看吧,这不是演员扮演的

圆梦的小老头
2026-03-24 13:38:33
章泽天看展带火春日穿搭叫“针织衫+弯刀裤”,配色清新很少女!

章泽天看展带火春日穿搭叫“针织衫+弯刀裤”,配色清新很少女!

明星私服穿搭daily
2026-03-26 09:44:53
55年授衔,当主席看到名单中有个熟悉的名字,大笔一挥:他不是少将

55年授衔,当主席看到名单中有个熟悉的名字,大笔一挥:他不是少将

睡前讲故事
2025-12-12 13:58:11
50℃高温锁住国运!电不够水没有,印度的未来,彻底没希望了?

50℃高温锁住国运!电不够水没有,印度的未来,彻底没希望了?

Hi科普啦
2026-03-25 14:57:31
传张雪峰二婚妻子清纯甜美:去年已生子,11岁女儿遗传继承恐生变

传张雪峰二婚妻子清纯甜美:去年已生子,11岁女儿遗传继承恐生变

博士观察
2026-03-25 21:33:04
清末民初:四川总督赵尔丰、冒着热气的小吃摊、末代状元刘春霖

清末民初:四川总督赵尔丰、冒着热气的小吃摊、末代状元刘春霖

历史小破站
2026-03-19 04:05:03
0.028%!无罪判决率跌至谷底,为何国际水平是我们的35倍?

0.028%!无罪判决率跌至谷底,为何国际水平是我们的35倍?

深析古今
2026-03-25 01:10:47
日军官闯中国使馆后,天皇玄孙迅速澄清,高市失声,特朗普没说错

日军官闯中国使馆后,天皇玄孙迅速澄清,高市失声,特朗普没说错

沧海旅行家
2026-03-26 13:46:41
伊朗没想到,等来的不是美军地面部队,而是特朗普的和谈请求

伊朗没想到,等来的不是美军地面部队,而是特朗普的和谈请求

孟彦说
2026-03-26 13:07:44
为什么只有革命卫队与美以干,而伊朗40万国防军沉默观战?

为什么只有革命卫队与美以干,而伊朗40万国防军沉默观战?

廖保平
2026-03-17 09:04:38
“只要决心够大,诺贝尔奖不在话下!”

“只要决心够大,诺贝尔奖不在话下!”

槽逻辑
2026-03-24 18:46:27
广汽集团,你疯了吗?

广汽集团,你疯了吗?

汽车K线
2026-03-26 09:20:19
冲突加剧,日本援兵赶到,中方直接封海四天,越南警告中国别造岛

冲突加剧,日本援兵赶到,中方直接封海四天,越南警告中国别造岛

云上乌托邦
2026-03-24 14:50:45
是否有中国船只顺利通过霍尔木兹海峡?外交部回应

是否有中国船只顺利通过霍尔木兹海峡?外交部回应

财联社
2026-03-25 15:46:15
2026-03-26 14:35:00
南方都市报 incentive-icons
南方都市报
换一种方式,南都在现场。
602930文章数 3587788关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

本地
艺术
时尚
旅游
游戏

本地新闻

春日吃花第三站——广东

艺术要闻

哪一座桥不是风景?

2026年了,最好看的还是“这件针织”!

旅游要闻

明起全面实行线上实名预约购票!云台山景区发布公告

IGN认为Xbox机会来了!新主机要转守为攻 重塑自我

无障碍浏览 进入关怀版