网易首页 > 网易号 > 正文 申请入驻

更低成本更高性能,阿里千问3引爆新一轮AI应用热潮?

0
分享至

4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),参数量仅为DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球最强开源模型。

千问3是国内首个混合推理模型,性能更高的同时成本大幅下降,其总参数为235B,仅为R1的三分之一。有机构测算,部署R1需16张H20芯片,而满血版千问3仅需4张,成本大降75%。

更重要的是,千问3为即将到来的智能体Agent和大模型应用爆发提供了更好的支持。在评估模型Agent能力的BFCL评测中,千问3创下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等顶尖模型。大幅降低Agent调用工具的门槛,或将引发新一轮AI应用爆发。

火星电波创始人、前MiniMax海螺AI产品负责人冯雷(橘子)在社交媒体上发布了他的测试体验。其中,Qwen3把各个MCP都调用成功了,但别的模型失败居多。他对界面新闻表示,从R1到千问3,工具调用能力已经进步了非常多。

Agent行业急需工具调用能力高的模型

Agent对模型能力的需求,取决于该 Agent 的任务复杂性和自治程度。

总体上,一个强健的Agent系统对底层模型的需求主要包括基础语言理解与生成、工具使用与调用、推理与规划等多方面的能力。简单来说,其需要准确理解指令和上下文以及多轮对话中的隐含意图和模糊表达,把复杂目标拆成子任务、按序执行。同时,这个系统还要理解和调用外部工具的流程,并执行API调用。

在Platform Thinking主理人、前知乎 COO张宁看来,目前Agent行业在底层模型上面临的痛点就是真正好工具调用能力的模型不多。

从千问3的性能和测试表现来看,阿里方面正在着力解决底层模型工具调用能力不足的痛点。可以在思考和非思考模式下精确集成外部工具,在复杂的基于代理的任务中在开源模型中表现领先。

在评估模型Agent能力的BFCL评测中,千问3创下70.8的新高,超越Gemini2.5-Pro、OpenAI-o1等顶尖模型,将大幅降低Agent调用工具的门槛。

千问3原生支持MCP协议,并具备强大的工具调用(function calling)能力,结合封装了工具调用模板和工具调用解析器的Qwen-Agent 框架,将大大降低编码复杂性,实现高效的手机及电脑Agent操作等任务。开发者要定义可用工具,可基于 MCP 配置文件,使用 Qwen-Agent 的集成工具或自行集成其他工具,快速开发一个带有设定、知识库RAG和工具使用能力的智能体。

同时,千问3在基础语言理解与生成能力和推理能力上也表现出不俗的能力。

这意味着,在同等模型能力的条件下,Agent以及AI应用行业调用模型的成本更低,调用更方便,这势必会促进更多新Agent以及AI应用的涌现。

坚定开源路线,多版本模型同时推出

千问3还提供了丰富的模型版本,包含2款30B、235B的MoE模型,以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型

其中,千问3的30B参数MoE模型实现了10倍以上的模型性能杠杆提升,激活3B就能媲美上代Qwen2.5-32B模型性能;千问3的稠密模型性能继续突破, Qwen3-4B 这样的小模型也能达到 Qwen2.5-72B-Instruct 的性能。

因为所有千问3模型都是混合推理模型,API可按需设置“思考预算”(即预期最大深度思考的tokens数量),进行不同程度的思考,灵活满足AI应用和不同场景对性能和成本的多样需求。中小企业和AI开发者可根据自己需求灵活选择模型,这势必会降低其使用大模型的门槛和成本。这些资金和人员都非常有限的团队可以把更多资源和精力投入到市场和用户需求痛点的挖掘上,以便能研发出更多创新应用。

在冯雷看来,Qwen 系列模型,因为开源、小巧、好微调的特点,已经成为很多开发者的首选模型。很多强化学习研究也都依赖Qwen 系列的高质量基座,因为基座模型的质量决定了后续强化学习的上限。

阿里云走到第16个年头,全面重构了一个从底层硬件到计算、存储、网络、数据处理、模型训练和推理平台的全栈技术架构体系,是亚太第一的云计算平台;而阿里也是全球最早投入大模型研究的科技公司之一

此前周靖人接受媒体采访时称,大模型发展和云体系的支撑不可分割。无论训练还是推理,大模型的每一次突破,表面看是模型能力演进,背后其实是整个云计算和数据、工程平台的全面配合和升级。多模态也是通向 AGI 的重要途径。

阿里Qwen 3发布后,马斯克在社交平台X上称,下周,Grok 3.5 早期测试版将仅向SuperGrok订阅者发布。它是第一个能够准确回答有关火箭发动机或电化学技术问题的人工智能。这也意味着Qwen 3在国际上同样有较高的关注度。

清华大学人工智能研究院常务副院长、欧洲人文和自然科学院外籍院士孙茂松表示,近年来在人工智能领域尤其是大模型的发展上,发出了很强烈的中国的声音,DeepSeek的出现以及通义千问的系列开源产品极大推动了国内大模型的开源路线,这无疑为缓解技术垄断,推动技术平权,提升人工智能的普惠性,无疑具有十分重要的作用。

目前,海内外开源社区中Qwen的衍生模型数量已突破10万,超越Llama系列衍生模型,通义千问Qwen稳居世界最大的生成式语言模型族群。根据Huggingface2025年2月10日最新的全球开源大模型榜单,排名前十的开源大模型全部是基于通义千问Qwen开源模型二次开发的衍生模型。

孙茂松认为,这意味着中国的大模型的文化在国际上得到了认可,这是在文化层面有某种扭转,外界看来似乎“漫不经心”,但这一点非常难能可贵,这实际上是认可中国大模型的发展和技术。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“我爸十几年没换过微信头像,这是我小学二年级画完送他的”

“我爸十几年没换过微信头像,这是我小学二年级画完送他的”

环球网资讯
2026-05-27 17:51:27
荨麻,不要读xún má,丢不起那个人!

荨麻,不要读xún má,丢不起那个人!

未央看点
2026-05-19 08:54:23
主持人“鞠萍姐姐”6月1日正式退休

主持人“鞠萍姐姐”6月1日正式退休

极目新闻
2026-05-30 14:28:53
接连发生事故致严重人员伤亡,河南省委书记:立即开展专项整治

接连发生事故致严重人员伤亡,河南省委书记:立即开展专项整治

澎湃新闻
2026-05-30 20:22:30
乌克兰拆解“榛树”导弹,结果震惊西方,七十年代古董为何能破盾

乌克兰拆解“榛树”导弹,结果震惊西方,七十年代古董为何能破盾

逐梦先锋
2026-05-29 18:25:51
多名特斯拉前员工坦言不信赖FSD,更有人称“给钱我都不坐”

多名特斯拉前员工坦言不信赖FSD,更有人称“给钱我都不坐”

IT之家
2026-05-30 17:29:05
中方劝告失效,李在明我行我素,向世界宣告,韩国加快引进核潜艇

中方劝告失效,李在明我行我素,向世界宣告,韩国加快引进核潜艇

铁锤简科
2026-05-30 12:42:24
6月5日起国内航线燃油附加费下调

6月5日起国内航线燃油附加费下调

起喜电影
2026-05-31 00:11:30
心理学:连旧衣服都舍不得扔的女人,骨子里大多是这两种人,很准

心理学:连旧衣服都舍不得扔的女人,骨子里大多是这两种人,很准

心理观察局
2026-05-30 06:58:08
塔帅:斯凯利首发?面对高位逼抢,拥有能摆脱的球员会很关键

塔帅:斯凯利首发?面对高位逼抢,拥有能摆脱的球员会很关键

懂球帝
2026-05-30 23:52:07
绍伊古承认俄罗斯在前线无法推进,理由是俄罗斯与56个国家作战

绍伊古承认俄罗斯在前线无法推进,理由是俄罗斯与56个国家作战

山河路口
2026-05-29 21:50:31
市值3万亿的味精厂,卡了英伟达的脖子,给全世界上了逆袭一课!

市值3万亿的味精厂,卡了英伟达的脖子,给全世界上了逆袭一课!

桑启红原
2026-05-29 21:47:03
继澳门输10亿传闻后,向太曝黄晓明曾当众给她下跪,陈凯歌没说错

继澳门输10亿传闻后,向太曝黄晓明曾当众给她下跪,陈凯歌没说错

漫婷侃娱乐
2026-05-29 21:29:36
本田全新倒三轮渲染图曝光,家用代步新选择

本田全新倒三轮渲染图曝光,家用代步新选择

味健的汽车
2026-05-28 06:35:15
比亚迪的4nm芯片,是自己造的,还是找谁代工的?

比亚迪的4nm芯片,是自己造的,还是找谁代工的?

互联网.乱侃秀
2026-05-30 15:17:53
穆里尼奥签约皇马,合同至2029年

穆里尼奥签约皇马,合同至2029年

体坛观察猿
2026-05-30 00:25:28
你曾经开过最烂的车是哪款车?网友:这个车0到100加速,少说30秒

你曾经开过最烂的车是哪款车?网友:这个车0到100加速,少说30秒

另子维爱读史
2026-05-28 08:01:14
难以置信!网传辽宁83年女生还是黄花闺女,哭诉三段恋情无疾而终

难以置信!网传辽宁83年女生还是黄花闺女,哭诉三段恋情无疾而终

火山詩话
2026-05-01 06:40:06
女主播在果园直播卖货,因太热开空调而露馅,背景全是假的

女主播在果园直播卖货,因太热开空调而露馅,背景全是假的

新游戏大妹子
2026-05-30 13:37:23
家属已报案!“23岁妹妹跟陌生女子出游后失联”,中领馆回应

家属已报案!“23岁妹妹跟陌生女子出游后失联”,中领馆回应

南方都市报
2026-05-30 10:49:39
2026-05-31 02:36:49
界面新闻 incentive-icons
界面新闻
只服务于独立思考的人群
1096114文章数 1335144关注度
往期回顾 全部

科技要闻

车圈大佬发声:价格战远去,但竞争仍残酷

头条要闻

两名9岁女孩被困电梯近2小时 求救几十次物业无动于衷

头条要闻

两名9岁女孩被困电梯近2小时 求救几十次物业无动于衷

体育要闻

岁月不饶人!39岁德约鏖战近5小时拼到呕吐

娱乐要闻

张碧晨《歌手》 “活人微死” 自嘲

财经要闻

双汇管不住一头猪

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

房产
本地
亲子
旅游
军事航空

房产要闻

红动五月!全国抢入核心资产,广州盯紧凯旋新世界!

本地新闻

用剪纸的方式,打开江苏扬州

亲子要闻

我在军博唱歌歌

旅游要闻

伊利亮相2026“跟着品牌去旅行”对接交流活动 以工业文旅融合彰显中国品牌力量

军事要闻

美防长参加"香会" 就美中关系最新表态

无障碍浏览 进入关怀版