网易首页 > 网易号 > 正文 申请入驻

DeepSeek新AI模型有多震撼?外媒:相当于30美元iPhone降临

0
分享至

DeepSeek(深度求索)再次推出新版开源AI模型,它的性能与美国最先进的AI模型虽然还有一些差距,但差距极小,成本低很多很多。西方许多人认为,美国限制中国AI发展的企图遇挫,中国正在加速前进,以更高效率打造高端AI模型。

去年12月,杭州幻方量化推出DeepSeek V3开源大语言模型,它的性能与OpenAI 40和Anthropic Claude 3.5 Sonnet差不多,当时OpenAI和Anthropic正在开发下一代模型。按照描述,V3的成本只有560万美元!要知道OpenAI、谷歌、Anthropic为了搭建、训练模型花费数亿美元,未来可能达几十亿。



Andrej Karpathy曾经说过,V3的投资“低得有些荒谬”,在资源受限的条件下,无论是研究还是工程,都取得了令人惊叹的成就。

DeepSeek创始人、CEO、幻方量化创始人梁文锋去年曾说:“对我们而言钱不是问题,先进芯片受限却是一个问题。”

V3是用Nvidia H800芯片训练的,它比美国版本性能弱一些,之后美国连Nvidia H800也禁了,不能向中国出售。

有人将同一时间发布的DeepSeek-R1-Zero和DeepSeek-R1进行了对比:

——DeepSeek-R1-Zero的优势:它具备创造性推理能力,擅长独立发现独特、创造性的推理策略。拥有自我验证与反思能力,可以验证自己的推理,在处理时进行反思,能有效进行长链思维。

——DeepSeek-R1的优势:可读性高,精准,模型输出的结果是可读的,更精致,出错率低。性能方面有强大竞争力,与最顶级的OpenAI模型可以一较高下,无论是数学、编程还是逻辑推理,都不逊色。

——DeepSeek-R1-Zero的弱点:输出有时会重复,显得杂乱,对用户不够友好,有时很难解释输出的结果。

相比较而言,DeepSeek-R1给出的结果更精致、更可靠,更加具有一致性。DeepSeek-R1-Zero在AI研究领域具有突破性意义,它向我们证明,单靠增强学习就能学会推理,不需要人类引导,这对AI发展来说具有里程碑意义。

R1是以Zero作为基础开发的,它将SFT和SR结合在一起,在性能、与人类偏好保持一致两个方面达到了平衡,更适合现实应用。



接下来让我们看看外媒都是如何评价的:

Venturebeat:中国企业戏剧性后来居上

最新的DeepSeek-R1性能与OpenAI开发的o1差不多,无论是数学、编程还是推理,都很出色。最让人吃惊的依然是成本,DeepSeek-R1的成本比o1低90-95%。

DeepSeek-R1的出现标志着开源模型取得了重大进步。它告诉我们,开源模型与闭源模型的差距正在缩小,二者将同时向AGI迈进。

报告显示,DeepSeek-R1在AIME2024数学测试中取得79.8%的成绩,与OpenAI o1的79.2%水平相当。在Codeforces测试中达到了2029的评分,超过96.3%的人类程序员(o1约为96.6%)。

英伟达高级科学家Jim Fan第一时间发表评论称,OpenAI的目标本来是开发真正开源、具有前沿性的AI模型,但现在这一目标却被一家非美国企业达成,最戏剧性的结果可能已经出现。在X平台上,他的评论目前已经被阅读106万次。

OpenAI o1的每百万tokens输入成本约为15美元,每百万tokens输出成本为60美元,DeepSeek Reasoner(基于R1模型)分别只有0.55美元和2.19美元。



Arstechnica:在硬件上进行本地处理将会实现

R1模型与其它大语言模型有着不同的运行机制,用到了所谓的“Inference-time reasoning approach”,也就是在模型推理阶段进行逻辑推理,这种推理方式和人类极为相似,又叫“模拟推理”(SR)。虽然SR推理给出回应时会慢一点,多耗费一点时间,但面对数学、物理、科学任务时结果更好。

不只是DeepSeek,中国的阿里巴巴、Kimi也都发布可以媲美o1的模型。

乔治梅森大学(George Mason University)AI研究人员Dean Ball说:“DeepSeek的小模型(distilled model,也就是R1的小号版本)性能让人惊叹,未来将会出现一大批推理能力不错的模型,它们可以在本地硬件上完成处理。”

forexlive网站:相当于30美元的iPhone问世

回想2017年时苹果推出iPhone X,售价999美元,手机狂卖,让苹果生态系统迅猛扩张。我们假设一下,如果有一家公司,它推出一款手机和一个手机平台,各方面更强,但价格只有30美元,会怎样?

没错,今天的AI世界正在发生这种戏剧性的变化。中国DeepSeek开源模型的性能居然追上了o1,但成本却低很多。不只如此,你还可以下载,免费使用。

无论是规模还是效率,R1取得了巨大进步,它改变了我们预期。我们曾经认为AI革命需要大量算力和电力,现在看来并非如此。就在新模型发布前几小时,特朗普刚刚宣布要投资1000亿美元在美国建设数据中心,同时还宣布与三家科技巨头开展5000亿美元AI项目.

DeepSeek告诉我们,在训练基本模型时有完全不同的可行方法,它们的效果同样好,但成本低无数倍。R1的到来可以让更多应用程序落地,之前这些程序因为成本过高不能推向市场,未来AI会在实体经济中有更大规模的应用。(小刀)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
S妈公开宣战后续,汪小菲取关S妈,还取关吴佩慈,原因疑曝光

S妈公开宣战后续,汪小菲取关S妈,还取关吴佩慈,原因疑曝光

小盖纪实
2025-02-13 14:58:19
中国那些曾红极一时的公司,现在一地鸡毛,下一个又会是谁?

中国那些曾红极一时的公司,现在一地鸡毛,下一个又会是谁?

慧翔百科
2025-01-24 11:46:20
孙一宁线下活动“见光死”,跟直播间差距太大,还是美颜太强大了

孙一宁线下活动“见光死”,跟直播间差距太大,还是美颜太强大了

观察鉴娱
2025-01-18 11:10:27
抗流感特效药来了!卫健委推荐了6种抗“甲流”特效药,赶快收藏

抗流感特效药来了!卫健委推荐了6种抗“甲流”特效药,赶快收藏

奇妙的本草
2025-02-11 18:00:02
最新!金华市委常委、常务副市长,已到任!

最新!金华市委常委、常务副市长,已到任!

浙中在线
2025-02-13 19:00:32
未来20年都几无武统的可能?

未来20年都几无武统的可能?

暖心的小屋
2025-02-13 21:59:59
职场女吹号手,还有市场吗?

职场女吹号手,还有市场吗?

趣闻分享1
2025-02-13 07:18:04
最新后续,合肥男子被礼花弹击离世,殡仪馆收到遗体,曝更多细节

最新后续,合肥男子被礼花弹击离世,殡仪馆收到遗体,曝更多细节

科学发掘
2025-02-13 12:33:07
莫耶斯:这一分确保我们仍是英超俱乐部;我对杜库雷感到失望

莫耶斯:这一分确保我们仍是英超俱乐部;我对杜库雷感到失望

懂球帝
2025-02-13 06:31:13
台湾著名歌手黄安疑似喊话大S妈:“缘随消旧业,莫再造新殃!”

台湾著名歌手黄安疑似喊话大S妈:“缘随消旧业,莫再造新殃!”

趣文史录
2025-02-13 15:37:48
大S登上纽约时报广场!「只播1分钟」费用超惊人 粉泪:她被默默爱着

大S登上纽约时报广场!「只播1分钟」费用超惊人 粉泪:她被默默爱着

ETtoday星光云
2025-02-13 11:20:28
退休教授夫妇因特别爱好,从28楼一跃跳下,死因却羞于启齿

退休教授夫妇因特别爱好,从28楼一跃跳下,死因却羞于启齿

纸鸢奇谭
2025-02-10 10:52:24
金价,跌了!油价,大跌!

金价,跌了!油价,大跌!

昆明信息港
2025-02-13 12:16:37
工厂憔悴女员工被辞退,领导表示:她就长这样,已报警处理!

工厂憔悴女员工被辞退,领导表示:她就长这样,已报警处理!

星光历史
2025-02-12 17:31:13
大S生前为了漂亮,坚持“腐素”饮食,这东西到底是啥?涨知识

大S生前为了漂亮,坚持“腐素”饮食,这东西到底是啥?涨知识

阿龙美食记
2025-02-13 20:37:57
尹锡悦八辩结束!当庭表情失控,赵成贤成破局关键,执政党急眼了

尹锡悦八辩结束!当庭表情失控,赵成贤成破局关键,执政党急眼了

鋭娱之乐
2025-02-13 22:52:31
法国AI峰会莫迪遭无视,印度假装是AI行业领头羊,被全球网友嘲讽

法国AI峰会莫迪遭无视,印度假装是AI行业领头羊,被全球网友嘲讽

小撇说事
2025-02-13 15:22:33
浓眉:我成添头了?交易后东契奇场均15+4 克里斯蒂场均17+5

浓眉:我成添头了?交易后东契奇场均15+4 克里斯蒂场均17+5

直播吧
2025-02-13 13:54:20
粉丝年前买的iPhone16Pro Max,刚过完年就被远程反锁了!

粉丝年前买的iPhone16Pro Max,刚过完年就被远程反锁了!

果粉使用技巧
2025-02-11 18:51:28
央视开始采用AI主持人!0失误宣布AI取代人类,我们还有班上吗?

央视开始采用AI主持人!0失误宣布AI取代人类,我们还有班上吗?

玫瑰讲娱
2025-02-11 22:59:41
2025-02-14 00:12:49
极客网 incentive-icons
极客网
科技使能新商业
2352文章数 2547关注度
往期回顾 全部

科技要闻

蔡崇信确认:阿里与苹果合作

头条要闻

特朗普与普京通话未提前通知 欧洲或面临3万亿美元账单

头条要闻

特朗普与普京通话未提前通知 欧洲或面临3万亿美元账单

体育要闻

NBA下一个“林疯狂”,会是他吗?

娱乐要闻

爆!李明德怒砸豪车,刑拘大瓜反转不断

财经要闻

哪吒"造"了一个光线传媒

汽车要闻

旧车置换补贴可达7万多 奇瑞风云T8将上市

态度原创

手机
房产
本地
数码
亲子

手机要闻

骁龙SM8845处理器已在路上:3nm+全自研架构,或替代骁龙8至尊版

房产要闻

重磅政策信号刚刚传出!海口这个安居房,销量开始爆发!

本地新闻

非遗版春节|古法滚元宵,年味儿一口爆浆

数码要闻

AMD RX 9070 XT参数曝光:3.1GHz 4096 流处理器,16GB GDDR6显存

亲子要闻

在这个家分工很明确的两个宝宝,萌死谁了啊啊啊

无障碍浏览 进入关怀版