全球领先的AI研究机构Artificial Analysis发布了最新的中国AI大模型的报告,其中对比了中美两国在AI大模型的各项数据。我们可以一窥中国大模型在全球的格局和地位。
人工智能在领导力领域的崛起
趋势:中国AI实验室(如DeepSeek、阿里巴巴)逐步缩小与美国(如OpenAI、Anthropic)的差距,部分中国模型(如DeepSeek R1)接近o1级智能(推测为性能等级)。
关键技术趋势
2024年底中国密集发布高性能模型(如DeepSeek V3),中美模型智能差距显著缩小。OpenAI于2024Q3首创“先思考后回答”的推理模型,中国实验室(如DeepSeek)快速跟进,已具备与c1级(对标标准)相当的推理能力。DeepSeek、阿里巴巴的开源模型(如Owen系列)接近o1级智能,推动技术普惠。
2024年底,DeepSeek取代阿里巴巴成为中国AI模型发布的领跑者,持续推出新模型(如R1、V3系列)。
中国AI实验室虽起步较晚,但2024年迅速缩小与美国顶尖模型(如OpenAI的O1)的差距,DeepSeek R1对标美国同类模型仅耗时数月。
开源模型全球竞争力:中国实验室(如DeepSeek、阿里巴巴、腾讯)发布的开源权重模型已达全球前沿水平。
2025年初,中国实验室(DeepSeek、阿里巴巴、月之暗面、智谱等)密集发布前沿推理模型,发布速度和数量表明其技术已不再落后。
美国在语言模型领域保持整体领先,多个模型得分较高(如OpenAI的o3和o1.得分94和90)。中国紧随其后,部分模型得分接近美国(如DeepSeek和o1-mini,得分89)。法国、加拿大和以色列等国家也有部分模型进入榜单,但得分相对较低(如加拿大的AI21 Labs模型得分为55)。
多个中国AI实验室已经展示了或声称达到了前沿级别的智能水平。其中,有七个模型具备推理能力。图表显示了中国AI实验室开发的模型在“Artificial Analysis Intelligence Index”中的得分。总体来看,中国AI实验室在语言模型领域,尤其是在推理能力方面,取得了显著进展,与美国的模型表现相当。
阿里巴巴、百度、字节跳动、华为和腾讯等公司发布了多个AI语言模型,涵盖推理和非推理能力。这些公司通过开放权重模型和专有模型推动AI技术发展。
▌主要AI模型及智能得分
阿里巴巴:Qwen 2.5 Max(79分)、QwQ(78分)。
百度:Ernie 4.0 Turbo(76分)。
字节跳动:Doubao 1.5 Lite(77分)、Doubao 1.5 Pro(80分)。
华为:Pangu 5.0 Large(74分)。
腾讯:混元Large(74分)。
中国AI初创公司,在中国大型科技公司和政府的支持下,这些公司开发了世界领先的开放权重模型。
▌主要AI模型及智能得分
MiniMax:MiniMax-Text-01(非推理,76分)、Kimi k1.5(推理,87分)。
Moonshot AI:V1-128k(非推理,52分)。
01.AI:Yi-Lightning(非推理,73分)、R1(推理,89分)。
DeepSeek AI:V3(非推理,79分)、GLM-Zero-Preview(推理,81分)。
Zhipu.AI:GLM-4-Plus(非推理,70分)。
Baichuan智能:Baichuan 4-Turbo(非推理,65分)、Baichuan M1-Preview(推理,83分)。
Stepfun:Step-2-16k(非推理,82分)、Step-R-mini(推理,84分)。
美国对中国出口高端AI加速器的限制时间线,以及NVIDIA GPU在不同限制下的状态。
美国对中国出口高端AI加速器的限制时间线及具体措施。
影响:TPP ≥ 4.800 或 TPP ≥ 1.600 且 PD ≥ 5.92.
特朗普政府可能进一步扩大受限芯片范围,H20可能被加入限制清单。总体来看,美国对NVIDIA高端GPU的出口限制严格,但H20和L20目前不受影响。
未来,中美AI竞争将继续推动技术发展。尽管美国在高端AI芯片出口方面对中国实施了严格限制,但中国AI实验室在语言模型方面取得了显著进展,全球AI技术的应用前景将更加广阔。
以上内容引自:Artificial Analysis。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.