网易首页 > 网易号 > 正文 申请入驻

赶超DeepSeek V3,阿里Qwen2.5-Max成非推理类中国大模型冠军

0
分享至

在农历除夕夜,阿里通义千问团队悄然上线大模型Qwen2.5-Max,让国内外网友再次看到了中国模型的非凡“模力”。

在2月4日凌晨,Chatbot Arena公布了最新的大模型盲测榜单,Qwen2.5-Max轻松办超越了行业翘楚DeepSeek V3、o1-mini和Claude-3.5-Sonnet等知名模型,以1332分位列全球第七名,也是非推理类的中国大模型冠军。

同时,Qwen2.5-Max在数学和编程等单项能力上排名第一,在硬提示(Hard prompts)方面排名第二。这一成就不仅标志着中国大模型在国际舞台上的崛起,也展现了阿里云在人工智能领域的强大实力。

一、Qwen2.5-Max性能表现惊艳!

由于使用了大规模MoE架构以及超过20万亿token的预训练数据,可以说Qwen2.5-Max在技术上真正做到了精雕细琢,也让Qwen2.5-Max基准在测试中表现极为惊艳!

我们都知道,Chatbot Arena LLM Leaderboard是业界公认的最公正、最权威榜单之一,它已经成为全球顶级大模型的重要竞技场其拥有一套独特且先进的评测体系,确保每一个参与的大模型都能得到公正、科学的评估,让全球用户都能清晰了解各模型的实力与特点。

在此次榜单更新中,Qwen2.5-Max的表现尤为突出。它不仅在综合排名上位列全球第七,还在数学和编程等单项能力上排名第一,在硬提示(Hard prompts)方面排名第二。

在实际评测中,Qwen2.5-Max多个基准测试中超越当红炸子鸡DeepSeek V3,展现出极强的综合性能,如在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等测试中,Qwen2.5-Max比肩Claude-3.5-Sonnet,并几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。

更令人惊叹的是,Qwen2.5-Max在多模态能力上也非常惊艳,例如在联网搜索功能中,它每一句输出都有清晰的来源标注,轻松畅快。用户可以仅用一句话,就能通过Qwen2.5-Max完成旋转球体等各种可视化创作。不仅如此,这款模型甚至能帮用户迅速开发出小游戏,比如丢掉手动操作,秒速玩转扫雷游戏。

另外,相比早期版本,Qwen2.5-Max的理解能力提升了46%,数学能力提升了75%,代码能力提升了102%,指令遵循能力提升了105%。Chatbot Arena官方更是评价称:“阿里巴巴的Qwen2.5-Max在多个领域表现强劲,特别是专业技术向的(编程、数学、硬提示等)。”这一评价也充分证明了Qwen2.5-Max在技术领域的卓越性能。

二、高性能低成本技术路线上的重大突破

除了基准测试中的出色表现,Qwen2.5-Max的核心竞争力在于“低成本高性能”。

在春节前,国内大模型公司靠低成本出圈。此次发布Qwen2.5-Max不仅带来了高性能,在低成本路线上也是更进一步。与DeepSeek V3等模型相比,Qwen2.5-Max的成本优势显著。

阿里云在博客文章中表示,Qwen 2.5-Max 是一个大规模混合专家 LLM 模型,该架构使公司能够以更小的资源消耗构建模型,这使得模型部署时能够使用更少的资源,并以更高的效率运行。

这将大大降低了AI应用的门槛,为中国AI产业带来新的活力。

想象一下,未来将有更多的中小企业和初创公司轻松拥抱AI技术?这或许将改变许多行业的游戏规则,大大提升国内各行业的全球竞争力。

三、国内外受到用户认可

目前,企业可以在阿里云百炼调用Qwen2.5-Max模型的API,开发者也可以在Qwen Chat平台中免费体验Qwen2.5-Max。

不少用户也开始纷纷在社交平台上分享自己的使用体验,有网友在对比DeepSeek-V3 和 Qwen 2.5后,高度赞扬了Qwen2.5-Max的出色表现

Chatbot Arena官方发推文称,以Qwen2.5-Max为代表的中国大模型正在迎头赶上。许多从业者惊叹于新模型的强大性能,甚至表示:“我们可以告别ChatGPT了!”这表明Qwen2.5-Max不仅在技术上取得了突破,也在行业认知中占据了重要地位。

也有网友打趣地为OpenAI的首席执行官Sam Altman担忧:又一个中国模型来了!

网友们也纷纷表示:中国新模型的迭代速度和质量令人惊艳。

四、阿里引领中国模型崛起

目前,Qwen2.5-Max采用了国际开源趋势,允许开发者广泛使用和创新。这种开放的态度不仅有助于推动技术的普及和应用,也为开发者提供了更多的创新机会。

而且阿里云并不是单打独斗,阿里云将Qwen2.5-Max部署在其百炼平台上,开发者可以通过API直接调用模型,从而实现快速开发和部署。此外,阿里云还通过这一策略吸引了大量开发者加入其生态系统,进一步巩固了其在AI领域的市场地位。

这与北美三大云服务商的模式相比,更具系统性和完整性。“超算集群+开源生态+云原生”三位一体架构,不仅保证了Qwen2.5-Max的性能发挥,也方便了它的市场推广。这种强有力的生态系统支持,让Qwen2.5-Max的应用落地成为可能,并推动中国AI产业整体向前发展。

未来,随着技术的不断进步和应用场景的拓展,Qwen2.5-Max有望在更多领域发挥重要作用,为中国乃至全球的人工智能发展贡献更多力量。

阿里云Qwen2.5-Max的成功是中国大模型崛起的一个重要标志。它不仅在技术上取得了突破,更在国际舞台上展现了中国人工智能的实力。我们期待Qwen2.5-Max在未来能够带来更多惊喜,推动人工智能技术的进一步发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1351:1096,国民党投票结果出炉,郑丽文通知全岛,一队人马抵京

1351:1096,国民党投票结果出炉,郑丽文通知全岛,一队人马抵京

墨兰史书
2026-02-02 18:17:23
绍伊古急飞北京谈撤侨?这次事情真的很严重

绍伊古急飞北京谈撤侨?这次事情真的很严重

李荣茂
2026-02-03 06:19:47
49年解放军开炮轰击英舰,斯大林惊了:毛泽东既有傲骨,更有虎胆

49年解放军开炮轰击英舰,斯大林惊了:毛泽东既有傲骨,更有虎胆

舆图看世界
2026-02-03 07:10:03
《哈佛深红》丨前哈佛大学校长萨默斯追求中国女性时,爱泼斯坦是他的“僚机”

《哈佛深红》丨前哈佛大学校长萨默斯追求中国女性时,爱泼斯坦是他的“僚机”

邸报
2025-11-18 10:03:34
哈登接连缺阵快船比赛,泰伦卢居然如此回应,不外乎三点原因

哈登接连缺阵快船比赛,泰伦卢居然如此回应,不外乎三点原因

姜大叔侃球
2026-02-03 11:09:16
你在闲鱼碰到过什么奇葩买家?网友的评论引起万千共鸣

你在闲鱼碰到过什么奇葩买家?网友的评论引起万千共鸣

另子维爱读史
2026-02-01 20:41:03
14死198伤只是开始?中日航线全停,高市赌局翻车,美国兜不住底

14死198伤只是开始?中日航线全停,高市赌局翻车,美国兜不住底

智慧生活笔记
2026-02-03 15:02:18
最新:乌克兰反攻赫尔松左岸!击沉俄罗斯军船

最新:乌克兰反攻赫尔松左岸!击沉俄罗斯军船

项鹏飞
2026-02-02 17:30:53
科尔:巴特勒受伤影响了库明加的交易,若后者留队将获重任

科尔:巴特勒受伤影响了库明加的交易,若后者留队将获重任

懂球帝
2026-02-03 13:03:06
钱再多有什么用!又一女星走上朱媛媛的后路,给中年女性提了个醒

钱再多有什么用!又一女星走上朱媛媛的后路,给中年女性提了个醒

削桐作琴
2026-02-03 15:24:49
全球为啥没一个国家仿造歼-20,瑞典已破译!

全球为啥没一个国家仿造歼-20,瑞典已破译!

老范谈史
2026-01-30 20:28:17
绝了!郭士强藏高招 男篮集训规模人数空前 让球迷无法挑刺?

绝了!郭士强藏高招 男篮集训规模人数空前 让球迷无法挑刺?

你看球呢
2026-02-03 14:35:03
“不好看,有点吓人!”艺考生晒堪比小燕子的大眼睛,引人不适!

“不好看,有点吓人!”艺考生晒堪比小燕子的大眼睛,引人不适!

观察鉴娱
2026-02-01 15:09:22
1949年,张治中弃暗投明留在北平,致信骂蒋介石:你缺乏自知之明

1949年,张治中弃暗投明留在北平,致信骂蒋介石:你缺乏自知之明

雍亲王府
2026-02-03 15:20:03
大S周年祭遗照曝光,具俊晔设计雕像被群嘲,葛思齐再发声惹众怒

大S周年祭遗照曝光,具俊晔设计雕像被群嘲,葛思齐再发声惹众怒

壹月情感
2026-02-03 13:05:16
知名媒体人刘虎被刑拘,涉诬告、非法经营罪

知名媒体人刘虎被刑拘,涉诬告、非法经营罪

无忌财谈
2026-02-02 17:31:32
方便球迷,铁路部门开通超级杯国安球迷观赛往返列车

方便球迷,铁路部门开通超级杯国安球迷观赛往返列车

懂球帝
2026-02-03 10:58:05
A股:重磅来了!十部门联合发文,AI大战一触即发,今天开始抄底?

A股:重磅来了!十部门联合发文,AI大战一触即发,今天开始抄底?

甜柠聊史
2026-02-03 09:44:58
最高检:严惩行贿犯罪,推进不正当利益追缴

最高检:严惩行贿犯罪,推进不正当利益追缴

澎湃新闻
2026-02-03 11:25:11
一年狂入725亿,村长身家165亿,浙江这个村盛产“亿元户”

一年狂入725亿,村长身家165亿,浙江这个村盛产“亿元户”

顾史
2026-02-02 21:25:38
2026-02-03 16:27:00
了不起的云计算
了不起的云计算
致力数字化转型的技术探讨
175文章数 137关注度
往期回顾 全部

科技要闻

1.25万亿美元!xAI员工赢麻了

头条要闻

北京菜百近200人排队卖金 有人一次性卖出200万元金条

头条要闻

北京菜百近200人排队卖金 有人一次性卖出200万元金条

体育要闻

“也许我的一小步,会成为中国足球的一大步”

娱乐要闻

小S致词:感谢具俊晔陪伴大S的最后3年

财经要闻

精神病医院骗保内幕调查:住院相当于坐牢

汽车要闻

问界M6官图首发 以年轻化设计叩击25-30万级市场

态度原创

房产
手机
数码
公开课
军事航空

房产要闻

大盘最低杀到8000+/㎡!海口59盘,最新房价曝光!

手机要闻

REDMI K90至尊版细节曝光:搭天玑9500,系小米首款主动散热手机

数码要闻

技嘉发布两款至强600工作站主板:最高支持86核与128条PCIe 5.0

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:庞大兵力将很快抵达伊朗

无障碍浏览 进入关怀版