网易首页 > 网易号 > 正文 申请入驻

DeepSeek:中国AI聊天应用全面解析

0
分享至


DeepSeek已经火遍全球。

这家中国AI实验室本周成功打入主流视野,其聊天机器人应用登上了苹果App Store和Google Play排行榜榜首。DeepSeek的AI模型采用计算效率优化技术进行训练,这让华尔街分析师和技术专家开始质疑美国能否在AI竞赛中保持领先地位,以及对AI芯片的需求是否能够持续。

但DeepSeek从何而来,又是如何迅速崛起并获得国际声誉的呢?

DeepSeek的交易员起源

DeepSeek由中国量化对冲基金幻方量化支持,该基金使用AI来指导其交易决策。

AI爱好者梁文锋于2015年联合创立了幻方量化。据报道,梁文锋在浙江大学求学期间开始涉足交易,并于2019年将幻方量化管理公司作为专注于开发和部署AI算法的对冲基金推出。

2023年,幻方量化成立了DeepSeek,作为独立于其金融业务的AI工具研究实验室。在幻方量化作为投资方之一的支持下,该实验室分拆成为独立公司,同样名为DeepSeek。

从成立之初,DeepSeek就建立了自己的数据中心集群来进行模型训练。但与中国其他AI公司一样,DeepSeek也受到了美国硬件出口禁令的影响。为了训练其较新的模型之一,该公司被迫使用英伟达H800芯片,这是美国公司可用的H100芯片的低功耗版本。

据说DeepSeek的技术团队偏向年轻化。据报道,该公司积极从中国顶尖大学招募AI博士研究人员。据《纽约时报》报道,DeepSeek还雇用没有计算机科学背景的人员,以帮助其技术更好地理解广泛的学科领域。

DeepSeek的强大模型

DeepSeek于2023年11月推出了首套模型——DeepSeek Coder、DeepSeek大语言模型和DeepSeek Chat。但直到去年春天,这家初创公司发布了下一代DeepSeek-V2系列模型,AI行业才开始关注。

DeepSeek-V2是一个通用的文本和图像分析系统,在各种AI基准测试中表现出色,运行成本也远低于当时的同类模型。这迫使DeepSeek的国内竞争对手,包括字节跳动和阿里巴巴,降低了部分模型的使用价格,并让其他模型完全免费。

2024年12月推出的DeepSeek-V3进一步提升了DeepSeek的知名度。

根据DeepSeek的内部基准测试,DeepSeek V3的性能超越了可下载的开放模型(如Meta的Llama)和只能通过API访问的"封闭"模型(如OpenAI的GPT-4o)。

同样令人印象深刻的是DeepSeek的R1"推理"模型。该模型于1月发布,DeepSeek声称R1在关键基准测试中的表现与OpenAI的o1模型相当。

作为推理模型,R1能够有效地自我事实核查,这有助于它避免通常困扰模型的一些陷阱。与典型的非推理模型相比,推理模型需要稍长时间——通常是几秒到几分钟——来得出解决方案。好处是它们在物理、科学和数学等领域往往更加可靠。

然而,R1、DeepSeek V3和DeepSeek的其他模型也存在缺点。作为中国开发的AI,它们受到中国互联网监管机构的基准测试,以确保其响应"体现核心社会主义价值观"。例如,在DeepSeek的聊天应用中,R1不会回答关于天安门广场或台湾自治的问题。

3月份,DeepSeek的访问量超过了1650万次。Similarweb编辑David Carr告诉TechCrunch:"3月份,尽管DeepSeek的流量比2月份下降了25%,但根据日访问量计算,它仍排名第二。"与3月份周活跃用户数量突破5亿的ChatGPT相比,这个数字仍然相形见绌。

5月,DeepSeek在开发者平台Hugging Face上发布了其R1推理AI模型的更新版本。

9月,DeepSeek推出了一个名为V3.2-exp的新实验模型,旨在在长上下文操作中大幅降低推理成本。

颠覆性方法

如果说DeepSeek有商业模式的话,目前还不清楚具体是什么模式。该公司的产品和服务定价远低于市场价值,还免费提供其他服务。尽管获得了大量风险投资的关注,但它也没有接受投资者资金。

按DeepSeek的说法,效率突破使其能够保持极强的成本竞争力。然而,一些专家对该公司提供的数据提出质疑。

无论如何,开发者已经开始采用DeepSeek的模型。这些模型虽然不是通常理解的开源模型,但在宽松许可下提供,允许商业使用。据托管DeepSeek模型的平台之一Hugging Face的CEO Clem Delangue称,Hugging Face上的开发者已经创建了超过500个R1的"衍生"模型,总下载量达到250万次。

DeepSeek相对于更大、更成熟对手的成功被描述为"颠覆AI"和"过度炒作"。该公司的成功至少在一定程度上导致了英伟达股价在1月份下跌18%,并引发了OpenAI首席执行官Sam Altman的公开回应。据路透社报道,3月份,美国商务部各局告诉员工,DeepSeek将被禁止在政府设备上使用。

微软宣布DeepSeek已在其Azure AI Foundry服务上提供,这是微软将企业AI服务整合在一个平台下的服务。在第一季度财报电话会议上被问及DeepSeek对Meta AI支出的影响时,首席执行官Mark Zuckerberg表示,AI基础设施支出将继续成为Meta的"战略优势"。3月份,OpenAI称DeepSeek"受国家补贴"和"受国家控制",并建议美国政府考虑禁止DeepSeek的模型。

在英伟达第四季度财报电话会议上,首席执行官Jensen Huang强调了DeepSeek的"卓越创新",表示它和其他"推理"模型对英伟达很有利,因为它们需要更多计算资源。

与此同时,一些公司正在禁用DeepSeek,包括韩国在内的整个国家和政府也是如此。纽约州也禁止在政府设备上使用DeepSeek。

5月份,微软副董事长兼总裁Brad Smith在参议院听证会上表示,出于数据安全和宣传担忧,微软员工不允许使用DeepSeek。

至于DeepSeek的未来会如何,目前还不清楚。改进的模型是肯定的。但美国政府似乎对其认为的有害外国影响越来越警惕。3月份,《华尔街日报》报道称,美国可能会禁止在政府设备上使用DeepSeek。

本文最初发布于2025年1月28日,将定期更新。

Q&A

Q1:DeepSeek是什么公司?背后有什么支持?

A:DeepSeek是由中国量化对冲基金幻方量化支持的AI实验室。该实验室于2023年成立,专门研究AI工具,后来分拆成为独立的AI公司。幻方量化由AI爱好者梁文锋于2015年联合创立,专注于开发和部署AI算法用于交易决策。

Q2:DeepSeek的AI模型有什么特别之处?

A:DeepSeek的模型采用计算效率优化技术训练,性能出色且成本极低。其V3模型在基准测试中超越了Meta的Llama和OpenAI的GPT-4o,R1推理模型能够自我事实核查,在物理、科学和数学等领域表现更加可靠,但响应时间稍长。

Q3:为什么DeepSeek会引起美国政府的担忧?

A:美国政府担心DeepSeek受中国政府控制,存在数据安全和宣传风险。该公司的模型需要符合中国互联网监管要求,体现"核心社会主义价值观",不会回答某些敏感话题。美国商务部和纽约州已禁止在政府设备上使用DeepSeek。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
Model YL获“北上广深”认可,为什么越发达地区越喜欢特斯拉?

Model YL获“北上广深”认可,为什么越发达地区越喜欢特斯拉?

据说无据
2026-01-19 10:36:21
丹麦养老基金将退出美国国债投资

丹麦养老基金将退出美国国债投资

财联社
2026-01-20 21:40:18
越南U23主帅赛前曾称希望与韩国会师决赛,结果双双落败

越南U23主帅赛前曾称希望与韩国会师决赛,结果双双落败

懂球帝
2026-01-21 01:58:03
贝克汉姆长子发文决裂:全家都在演戏!曝维多利亚贴身热舞太恶心

贝克汉姆长子发文决裂:全家都在演戏!曝维多利亚贴身热舞太恶心

胡一舸南游y
2026-01-20 19:32:32
失业的人越来越多了

失业的人越来越多了

曹多鱼的财经世界
2025-12-24 14:56:20
早大开除8名中国籍学生,803名考生TOEIC成绩被判无效!史上最大规模作弊震惊日本!

早大开除8名中国籍学生,803名考生TOEIC成绩被判无效!史上最大规模作弊震惊日本!

东京新青年
2026-01-19 18:50:50
餐饮业的整体处境,可能比西贝更糟糕

餐饮业的整体处境,可能比西贝更糟糕

冰川思想库
2026-01-20 11:35:48
惨败19分!北京揪最大战犯,空篮不进忙活半天只抢1板,软如面条

惨败19分!北京揪最大战犯,空篮不进忙活半天只抢1板,软如面条

后仰大风车
2026-01-20 21:33:49
中国3-0越南晋级决赛!没想到赛后澳媒、日媒、韩媒这么评价中国

中国3-0越南晋级决赛!没想到赛后澳媒、日媒、韩媒这么评价中国

金风说
2026-01-21 02:42:01
美女美图8424期

美女美图8424期

动物奇奇怪怪
2026-01-20 00:01:28
贝克汉姆长子在说谎?英国媒体爆料婚纱实情:为妮可拉准备了一年

贝克汉姆长子在说谎?英国媒体爆料婚纱实情:为妮可拉准备了一年

译言
2026-01-20 21:53:55
CBA最新消息!北京首钢换掉贝利,张宁第1阶段确定报销

CBA最新消息!北京首钢换掉贝利,张宁第1阶段确定报销

体坛瞎白话
2026-01-21 08:14:29
滚出去!中国不是“捡破烂”的:日本混不下去,就想回中方捞金?

滚出去!中国不是“捡破烂”的:日本混不下去,就想回中方捞金?

比利
2026-01-20 14:37:21
亚足联严惩!越南队吃红牌细节曝光,犯规动作恶劣 中国队应上诉

亚足联严惩!越南队吃红牌细节曝光,犯规动作恶劣 中国队应上诉

何老师呀
2026-01-21 03:23:34
刚刚!华为鸿蒙突然大更新,新界面长这样!

刚刚!华为鸿蒙突然大更新,新界面长这样!

科技堡垒
2026-01-20 12:27:42
牢A讲述美国华裔之:活着的“清朝人”,一个颠覆认知的逆天群体

牢A讲述美国华裔之:活着的“清朝人”,一个颠覆认知的逆天群体

元爸体育
2026-01-19 01:28:27
此前黄牌已经洗掉,若进入决赛累计两黄的胡荷韬可正常出战

此前黄牌已经洗掉,若进入决赛累计两黄的胡荷韬可正常出战

懂球帝
2026-01-21 01:16:17
东北一场大雪,新能源车又闹出各种妖,取代燃油车并不现实?

东北一场大雪,新能源车又闹出各种妖,取代燃油车并不现实?

鱼汤趣视界
2026-01-18 14:34:51
10万亿度需求也不买!中国摊牌,输电专线全叫停,国产电价教做人

10万亿度需求也不买!中国摊牌,输电专线全叫停,国产电价教做人

三农老历
2026-01-20 13:59:59
闲鱼不愧是全国最大的黑市,网民:只有你想不到,没有你买不到

闲鱼不愧是全国最大的黑市,网民:只有你想不到,没有你买不到

小熊侃史
2026-01-16 07:40:07
2026-01-21 09:27:00
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
15577文章数 49685关注度
往期回顾 全部

科技要闻

走进车间,感受中国低轨卫星互联网“加速度”

头条要闻

牛弹琴:特朗普和马克龙直接开干 马克龙疾呼欢迎中国

头条要闻

牛弹琴:特朗普和马克龙直接开干 马克龙疾呼欢迎中国

体育要闻

勇士遭暴击!巴特勒重伤赛季报销

娱乐要闻

网红版闫学晶!600万粉博主阿爆翻车

财经要闻

拆解涉税黑中介虚开套路

汽车要闻

奇瑞张贵兵:墨甲不做秀技术的企业 只做痛点终结者

态度原创

房产
游戏
家居
本地
公开课

房产要闻

中旅・三亚蓝湾发布会揭秘自贸港好房子高阶形态

魔兽世界:橙装2W金起包,团长吃1万红包,为什么没有人抵触?

家居要闻

隽永之章 清雅无尘

本地新闻

云游辽宁|漫步千年小城晨昏,“康”复好心情

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版