网易首页 > 网易号 > 正文 申请入驻

赛道Hyper | 追平全球顶级:千问3推理模型开源

0
分享至

作者:周源/华尔街见闻

7月25日,阿里巴巴开源千问3推理模型。

这是千问系列中首个采用混合专家MoE(Mixture of Experts)架构的代码模型,总参数达480B(4800亿),原生支持256K token的上下文,可扩展至1M长度,能帮助程序员完美完成写代码、补全代码等基础编程任务,大幅提升编程工作效率。

混合专家模型(MoE)是一种高效的神经网络架构设计,核心思想是通过分工协作提升模型性能,同时控制计算成本,尤其在大模型参数规模突破千亿、万亿级后,成为平衡性能与效率的关键技术。

简单说,MoE架构就像一个智能团队:有很多专业分工的成员(专家),但每次任务只让最适合的几个人干活(门控调度),既保证了效率,又能应对更复杂的需求。

据公开消息称,该模型性能提升显著,在知识储备、编程能力、数学运算等关键维度,与Gemini-2.5 pro、o4-mini等全球顶级闭源模型水平相当。

在7月21日至7月25日期间,阿里连续开源3款重要模型,成就斐然,在基础模型、编程模型、推理模型领域均获全球开源冠军。

这一系列动作不仅让技术开发者投入研究,也让企业决策者关注这些技术成果在实际业务中的应用,其落地可能对AI领域技术应用格局产生积极影响。

通义千问3旗舰模型发布后,通义团队持续优化推理能力。

新开源的千问3推理模型支持256K上下文长度,这一特性使其能轻松处理长篇文档和多轮对话,避免关键信息丢失。

在知识测评((SuperGPQA)、编程能力测评(LiveCodeBench v6)等测试中,表现接近顶尖闭源模型,在开源模型中处于前列。

相比前代模型,该模型的复杂问题拆解分析、流畅度和精准度均有明显提升:比如在处理多步骤逻辑推理题时,能更清晰地呈现推理过程。

在此期间开源的Qwen3-235B-A22B-Instruct-2507(非思考版)性能提升明显,在GPQA知识测评、AIME25数学测评等涵盖多能力维度的测试中,成绩超过Claude4(Non-thinking)等闭源模型。

这些测试从知识覆盖范围、数学逻辑运算、代码编写准确性等多个角度,全面衡量模型的综合能力。

AI研究机构Artificial Analysis经测试数据对比,评价新开源的千问3模型“在非思考基础模型中表现突出”,这一评价基于模型在各项指标上的具体表现得出。

AI编程领域的Qwen3-Coder,在多语言SWE-bench等测试中表现超过GPT4.1和Claude4,成功登顶HuggingFace模型总榜。

该榜单综合模型下载量、使用频率、用户评分等多方面数据排名,在行业内认可度较高。

从实际应用来看,程序员借助它生成基础品牌官网最快仅需5分钟,刚入行的程序员一天就能完成资深程序员一周的工作。

截至目前,阿里巴巴已开源300余款通义大模型,衍生模型数量超过14万个,超过Meta的Llama系列,成为规模巨大的开源模型家族,在开发者和企业中被广泛使用。

这些衍生模型经全球开发者根据不同场景微调,应用于教育、金融、医疗等多个行业,比如教育领域的衍生模型可辅助教师生成个性化习题,金融领域的模型能做简单的风险评估。

据海外知名模型API聚合平台OpenRouter数据显示,阿里千问API调用量暴涨,截至7月25日,在过去数天内调用API规模已突破1000亿Tokens,在OpenRouter趋势榜上包揽全球前三,是当下最热门的模型。

这一数据反映出模型的受欢迎程度,尤其受到中小型开发团队青睐,因为其开源属性降低了使用成本,同时性能能满足项目需求。

阿里开源模型允许中国企业免费商用,这一政策降低了中小企业应用AI技术的门槛,让更多企业能享受到技术红利;同时向美国、法国、德国等国家的企业开放,助力欠发达国家获得本土衍生模型,丰富了AI开源社区的多样性,推动技术在全球范围内普及。

华尔街见闻注意到,企业落地AI时,往往将模型与云产品打包采购。

比如电商企业使用通义千问模型做客户服务智能回复时,会配套采购阿里云的数据库存储客户信息,以及阿里云的安全服务保障数据安全,形成生态闭环。

这种模式提升了阿里云产品的使用深度与客户关联度,增强了客户粘性。

当前,部分组织将AI工作负载迁移至云端,已部署云架构的企业也在积极将AI能力融入自身系统,这带来了对GPU资源、IaaS服务(基础设施即服务:Infrastructure as a Service)的持续需求。

千问3系列模型的良好表现,将助力阿里云吸引更多客户,促进公有云业务发展,尤其是在需要强大AI算力支持的领域。

千问3推理模型在开源模型中表现突出,源于通义团队对技术架构和算法的持续优化。

256K上下文长度使其在处理长文本任务时优势明显:在法律行业,能辅助审查长篇合同,精准提炼条款、权责划分与风险点,减少人工审查的疏漏;在科研领域,可快速抓取学术论文的研究背景、实验方法和核心结论,帮助研究人员节省阅读时间;在知识问答、代码生成等场景,其表现接近顶尖闭源模型。

Qwen3-235B-A22B-Instruct-2507(非思考版)的性能提升,得益于训练技术的改进。

关于这个模型的名称:“Qwen”是阿里千问的英文标识,“3”代表该模型属于千问系列的第3代版本,用于区分早期的Qwen1和Qwen2版本;“235B”即参数规模为2350亿;“A22B”通常与模型架构、训练配置或硬件适配相关(不同厂商的命名规则可能有差异)。

“Instruct”表示模型类型是“指令微调模型”(Instruct-tuned Model)。这类模型在预训练后,会通过人类指令数据进一步微调,更擅长理解和执行用户的自然语言指令(如“写一段代码”或“总结文档”),而非单纯的文本续写,实用性更强。

“2507”应该是版本日期或迭代编号,这里可能指“2025年7月”(或类似的内部版本时间),用于区分同一基础模型的不同迭代版本(比如修复了某些问题、优化了特定任务性能的更新版)。

这个模型在预训练阶段使用的36T tokens数据集,涵盖书籍、代码库等多种类型,保障了知识的广度与深度,使模型能应对不同领域的知识查询;后训练通过多轮强化学习,整合非思考与思考模型,优化了综合性能,让模型在处理不同类型任务时更灵活。

Qwen3-Coder在代码能力上的突破,来自改进的Transformer架构和优化的Agent调用流程。

其中,改进的Transformer架构提升了编程需求理解精度,当开发者输入“编写一个用户注册的后端接口”指令时,能准确把握接口需要实现的功能和参数要求;优化的Agent调用流程提高了工具调用效率,在需要调用外部代码库时,能更快速地完成匹配与调用,使其在多语言测试中领先,登顶HuggingFace榜单。

从生态角度看,Qwen3-Coder吸引了大量二次开发:开发者为其添加特定行业代码库,使其在金融科技领域能生成更符合行业规范的代码;还有开发者优化其响应速度,让它更适用于实时性要求高的在线编程场景。

目前,300余款通义大模型及14万个衍生模型,在科研、教育等行业广泛应用,推动AI技术从实验室走向实际生产生活,为各行业更高的效率提升。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
官媒发文,38岁王思聪再破天花板,让王健林和整个商界沉默了

官媒发文,38岁王思聪再破天花板,让王健林和整个商界沉默了

琨玉秋霜
2026-01-17 05:51:43
原来聂卫平的父亲是他,难怪能够十连胜为国争光,真是虎父无犬子

原来聂卫平的父亲是他,难怪能够十连胜为国争光,真是虎父无犬子

以茶带书
2026-01-16 17:17:29
13票赞成!中俄当场弃权,联合国要求归还资产,内塔直接下令退群

13票赞成!中俄当场弃权,联合国要求归还资产,内塔直接下令退群

花心电影
2026-01-17 05:58:08
分手后局长找到我:我离异咱俩试试?我同意了,5个月后我怀双胎

分手后局长找到我:我离异咱俩试试?我同意了,5个月后我怀双胎

星宇共鸣
2026-01-13 09:27:02
第87分钟绝平!意甲劲旅翻车,4.3亿豪阵也没用,争四前景悲观

第87分钟绝平!意甲劲旅翻车,4.3亿豪阵也没用,争四前景悲观

足球狗说
2026-01-17 06:06:10
她14岁已是“人间尤物”,被首富看中花10亿娶回家,8年生了四胎

她14岁已是“人间尤物”,被首富看中花10亿娶回家,8年生了四胎

LULU生活家
2026-01-16 18:50:49
大师赛吴宜泽6-0零封肖国栋创历史,下轮挑战世界前3

大师赛吴宜泽6-0零封肖国栋创历史,下轮挑战世界前3

老牛体育解说
2026-01-17 00:39:09
免税结束,车市“凉凉”?

免税结束,车市“凉凉”?

汽车公社
2026-01-15 08:43:51
四问今年首场大范围寒潮:雨雪冰冻降温有多强 影响持续多久?

四问今年首场大范围寒潮:雨雪冰冻降温有多强 影响持续多久?

北青网-北京青年报
2026-01-16 17:02:56
尹锡悦被判处有期徒刑 5年

尹锡悦被判处有期徒刑 5年

每日经济新闻
2026-01-16 14:37:36
斯诺克赛程:决出4强,2大世界冠军PK,吴宜泽德比战对阵肖国栋!

斯诺克赛程:决出4强,2大世界冠军PK,吴宜泽德比战对阵肖国栋!

刘姚尧的文字城堡
2026-01-16 07:04:01
养女是软肋,丈夫是铠甲,贺娇龙身后的家庭,藏着最动人的温柔

养女是软肋,丈夫是铠甲,贺娇龙身后的家庭,藏着最动人的温柔

牛锅巴小钒
2026-01-17 01:28:50
一级致癌物被揪出,医生劝告:请立即停止食用,真不是说假话

一级致癌物被揪出,医生劝告:请立即停止食用,真不是说假话

健康之光
2026-01-16 16:50:03
余则成赴台前,在翠平衣服袖口内缝一铜扣,19年后翠平拆开看崩溃

余则成赴台前,在翠平衣服袖口内缝一铜扣,19年后翠平拆开看崩溃

星宇共鸣
2026-01-12 10:41:58
“吃到一万四再让我服务!”上海一网红餐厅服务员被曝辱骂顾客,老板:非常震惊,已开除;网友吵翻

“吃到一万四再让我服务!”上海一网红餐厅服务员被曝辱骂顾客,老板:非常震惊,已开除;网友吵翻

环球网资讯
2026-01-16 12:37:07
U23亚洲杯日本首次丢球!被轰远射世界波,5场0失球纪录告破

U23亚洲杯日本首次丢球!被轰远射世界波,5场0失球纪录告破

奥拜尔
2026-01-16 20:07:28
心酸!宁夏装死小羊晕倒原因解密,孩子衣服成关键线索,真相曝光

心酸!宁夏装死小羊晕倒原因解密,孩子衣服成关键线索,真相曝光

鋭娱之乐
2026-01-16 14:59:04
1962年,我国为何将长白山一半划给了朝鲜?其实谈判背后意义重大

1962年,我国为何将长白山一半划给了朝鲜?其实谈判背后意义重大

文史道
2026-01-13 12:47:43
2026广东省考笔试成绩正式公布!3月6日起面试

2026广东省考笔试成绩正式公布!3月6日起面试

广东发布
2026-01-15 14:07:15
功德林特赦第一人吴绍周:1952年就被特赦出狱,隐姓埋名平凡生活

功德林特赦第一人吴绍周:1952年就被特赦出狱,隐姓埋名平凡生活

古书记史
2026-01-12 21:52:59
2026-01-17 06:28:49
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
140245文章数 2652156关注度
往期回顾 全部

科技要闻

贾国龙与罗永浩被禁言,微博CEO回应

头条要闻

罗永浩、贾国龙微博账号均被禁言

头条要闻

罗永浩、贾国龙微博账号均被禁言

体育要闻

全队身价=登贝莱,他们凭什么领跑法甲?

娱乐要闻

李湘翻车,早就有迹可循!

财经要闻

清流|酒店商家在携程和美团之间沦为炮灰

汽车要闻

方程豹品牌销量突破30万辆 2026年还将推出轿跑系列

态度原创

游戏
本地
教育
艺术
公开课

十三年后,《逆战:未来》想为所有逆行者们找回青春"/> 主站 商城 论坛 自运营 登录 注册 十三年后,《逆战:未来》想为所有逆行者们找回青春 廉颇 2...

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

教育要闻

初中三年,最怕“掉队式沉默”

艺术要闻

齐白石画头毛驴当马卖,卖了1300万,网友:笑喷了!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版