网易首页 > 网易号 > 正文 申请入驻

阿里又开源两款Qwen3模型!拿下文本嵌入模型SOTA,技术报告公布

0
分享至

智东西6月6日消息,昨天,阿里巴巴宣布推出Qwen3-Embedding和Qwen3-Reranker系列模型,正式发布Qwen3-Embedding和Qwen3-Reranker系列大模型技术报告,首次公开开源模型Qwen3-Embedding和Qwen3-Reranker的推理架构、训练策略及评测结果。

Qwen3-Embedding和Qwen3-Reranker,均基于Qwen3基础模型训练,专为文本表征、检索与排序任务设计。其中,Qwen3-Embedding接收单段文本,将其转换为语义向量,以用于语义搜索、问答系统等场景。Qwen3-Reranker则接收文本对,利用单塔结构计算并输出两个文本的相关性得分,可在各类文本检索场景中显著提升搜索结果的相关性。在实际应用中,二者常结合使用,比如在RAG系统里,Qwen3-Embedding用于初步检索,Qwen3-Reranker用于优化候选结果,兼顾效率和精度。

Qwen3-Embedding 8B以70.58分登顶MTEB(当前全球公认的文本嵌入模型评测基准,通过整合检索、聚类、分类等7大场景,系统评估向量模型的语义表征能力)多语言榜全球第一,创历史新高(截至2025年6月6日);Qwen3-Reranker在mMARCO跨语言检索中MRR@10达0.42,超越行业标杆。双模型支持119种语言及编程语言,提供0.6B/4B/8B全尺寸覆盖,其中Reranker对100文档排序延迟压至80ms内(A100),长文本处理突破32k上下文。即日起双模型在Hugging Face/GitHub/ModelScope开源免费商用,阿里云API同步上线。

模型地址:

https://github.com/QwenLM/Qwen3-Embedding

https://huggingface.co/collections/Qwen/qwen3-reranker-6841b22d0192d7ade9cdefea

一、阿里巴巴发布Qwen3-Embedding模型,模型多语言得分超70

阿里巴巴昨天正式推出Qwen3-Embedding文本向量模型,提供0.6B、4B、8B三档参数规模,全面覆盖轻量级边缘计算到高性能云端场景。该模型支持119种自然语言及Python、Java等编程语言,并突破性地实现32k tokens长文本处理能力。

目前Qwen3-Embedding模型以Apache 2.0协议免费开源,开发者可通过Hugging Face、ModelScope及阿里云API一键部署。

在权威评测中,Qwen3-Embedding 8B版本以70.58分登顶MTEB多语言Leaderboard榜单(截至2025年6月6日),超越Google Gemini-Embedding等商业模型。

Qwen3-Embedding模型在代码检索(MTEB-Code)任务中,搜索精准度排名第一。

在多模态文本嵌入(MTEB)跨语言场景下,Qwen3-Embedding 8B模型在多语言检索任务中取得了69.02的高分,在中文检索任务中得分达到77.45,在英文检索任务中得分达到69.76。

除此,技术报告还透露,Qwen3 Embedding依托Qwen3基座模型的深度语言理解能力,创新采用双编码器架构,能独立处理查询文本与文档内容,生成高精度语义向量。

Qwen3-Embedding模型采用三阶段训练框架:首阶段基于36万亿token多语言数据弱监督预训练,第二阶段融合MS MARCO标注数据进行监督微调,最终通过模型融合技术提升泛化性。推理层面Qwen3-Embedding模型创新性支持自定义指令模板,使特定任务性能提升3%-5%。

Qwen3-Embedding的核心优势在于多语言深度适配(跨语言检索误差率降低30%)、长文本处理标杆级能力(32k窗口+双块注意力机制),以及灵活定制化设计(竞品如OpenAI text-embedding仅支持固定维度)。

同时,Qwen3-Embedding模型的开源免费策略显著降低技术门槛,中小企业可零成本构建文档检索、知识库聚类等系统,可能使多语言文本处理技术进入普惠化应用阶段。

二、32k长文档精准排序:Qwen3-Reranker支持法律科研检索99%稳定性

阿里巴巴的Qwen3-Reranker系列模型专门用于提升搜索和推荐系统相关性排序能力的模型,该系列提供0.6B/4B/8B三档参数规模。Qwen3-Reranker系列模型专为文本表征、检索与排序任务设计。该系列模型采用基于Qwen3基础模型的稠密版本,并与Qwen3-Embedding模型协同构建端到端检索链路。

Qwen3-Reranker系列模型的32k tokens上下文窗口专为法律文书、科研论文等长文档排序优化,显著提升长文本处理稳定性。模型以Apache 2.0协议开源免费,开发者可通过Hugging Face、GitHub、ModelScope获取,或通过阿里云API一键调用集成。

Qwen3-Reranker模型采用单塔交互结构,将用户查询与候选文档拼接输入,通过动态计算查询-文档交互特征输出相关性得分,实现非静态向量匹配的实时排序。

针对长文档场景,Qwen3-Reranker模型集成RoPE位置编码与双块注意(Dual Chunk Attention)机制,有效避免长程信息丢失,确保32k上下文内语义连贯性。

同时,Qwen3-Reranker模型支持任务指令微调,开发者可通过自定义指令(如“按病例描述相关性排序”)优化特定领域性能,实测可提升排序准确率3%-5%,而竞品如ColBERT缺乏此类功能。

阿里巴巴Qwen3-Reranker系列模型提供了三种不同参数规模的模型配置,分别为0.6B、4B和8B参数,以满足不同场景下的性能与效率需求。

Qwen3-Reranker 0.6B模型参数量为0.6B,属于超小型模型,适合端侧设备部署。其上下文长度达32k,采用基于Transformer的架构,以RMSNorm对层输入进行归一化,确保训练稳定;Qwen3-Reranker 0.6B模型能无缝集成两种思考模式,在保持推理效率的同时,展现出良好的多语言处理能力。

Qwen3-Reranker 4B模型参数量为4B,性能匹敌Qwen2.5-72B-Instruct。Qwen3-Reranker 4B模型同样具备32k的上下文长度,它通过多项架构增强提升语义理解能力;Qwen3-Reranker 4B模型在AIME25(美国数学邀请赛)评测中得分为81.5,刷新了开源模型记录,展现出强大的数学推理能力,能够处理复杂的数学问题,进行严谨的计算和多步推理。

Qwen3-Reranker 8B模型参数量为8B,上下文长度在标准配置下为32768个 Token;Qwen3-Reranker 8B在多语言检索任务中取得了69.02分,性能超越bge-reranker-large等开源竞品;在中文检索任务中得分达到77.45,在英文检索任务中得分达到69.76,显著优于传统BM25和ColBERT等其他基线模型。

另外,Qwen3-Reranker模型或推动高精度检索技术普及,企业知识库问答准确率提升40%,大幅降低人工成本;跨境电商实现119语言商品精准搜索,误检率下降35%;科研法律领域长文档检索效率突破90%,加速信息提取。

阿里巴巴的开源策略激活开发者生态,通过Hugging Face快速微调行业模型,阿里云API支持5行代码接入,极大降低技术门槛。同时推动文本检索从“关键词匹配”升级至“语义理解+动态交互”,为AI Agent与多模态应用奠定基础。

结语:告别通用泛化!阿里报告揭示:文本处理进入精准专用

Qwen3-Embedding/Reranker通过“多语言+长文本+可定制”三位一体设计,解决了传统文本处理模型泛化性差、成本高的痛点。其开源策略更将加速产业应用创新,开发者可基于Hugging Face快速微调,企业可通过阿里云API即时部署。阿里巴巴在文本嵌入领域的技术布局覆盖从轻量级到高性能的全场景需求。

技术报告特别提醒,在实际检索场景中,建议应用者根据具体任务、语言和场景设计指令模板,否则可能影响效果。这一细节可能反映出AI模型正从“通用泛化”向“精准专用”演进,也为行业提供了新的优化思路。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张雪峰去世真相!网友:偌大的公司靠他个人ip养活,早死是必然的

张雪峰去世真相!网友:偌大的公司靠他个人ip养活,早死是必然的

火山詩话
2026-03-25 09:18:58
女子在按摩店做理疗时被技师偷走金项链

女子在按摩店做理疗时被技师偷走金项链

新闻晨报随申Hi
2026-03-26 09:56:05
阿根廷世界杯名单已定20人!16大名将争最后6席 21岁加纳乔已出局

阿根廷世界杯名单已定20人!16大名将争最后6席 21岁加纳乔已出局

我爱英超
2026-03-26 19:07:13
广东一男子买啤酒抽中电动车大奖,将中奖二维码发网上询问后被他人扫走核销,网友:“这下又上了一课”

广东一男子买啤酒抽中电动车大奖,将中奖二维码发网上询问后被他人扫走核销,网友:“这下又上了一课”

洪观新闻
2026-03-26 10:56:49
很多人都患过“带状疱疹”,却不知它和“老年痴呆”有关!了解下

很多人都患过“带状疱疹”,却不知它和“老年痴呆”有关!了解下

岐黄传人孙大夫
2026-03-26 20:45:03
美国记者挖坑提问:万一台湾不想被统一怎么办?被中方精准反杀

美国记者挖坑提问:万一台湾不想被统一怎么办?被中方精准反杀

雪中风车
2026-02-23 19:34:34
卡塔尔正式宣布暂停跟中国的合同,而且短时间内不会恢复

卡塔尔正式宣布暂停跟中国的合同,而且短时间内不会恢复

南权先生
2026-03-25 15:19:55
翻到张雪峰2016年婚纱照,瞬间看哭了!

翻到张雪峰2016年婚纱照,瞬间看哭了!

魔都姐姐杂谈
2026-03-26 22:06:50
继张雪峰之后,中医大师黄贵华被曝心梗去世,社交账号已变黑白

继张雪峰之后,中医大师黄贵华被曝心梗去世,社交账号已变黑白

180视角
2026-03-26 11:52:12
“一降价还不是像狗一样跑过来!”罗技广告辱骂用户遭全网声讨…

“一降价还不是像狗一样跑过来!”罗技广告辱骂用户遭全网声讨…

柴狗夫斯基
2026-03-26 21:06:15
美团:2025年营收3,648.5亿元人民币 同比增长8.1%

美团:2025年营收3,648.5亿元人民币 同比增长8.1%

财联社
2026-03-26 17:40:04
勇敢发声!科威特记者联合国痛批“反以仪式”

勇敢发声!科威特记者联合国痛批“反以仪式”

Nee看
2026-03-26 14:15:21
张雪峰去世事件升级!很多人连夜下单AED,有店铺一天销售100多台

张雪峰去世事件升级!很多人连夜下单AED,有店铺一天销售100多台

火山詩话
2026-03-26 07:32:38
没想到不翻不知道,一翻吓一跳,张雪峰几乎每个月都在网上喊累

没想到不翻不知道,一翻吓一跳,张雪峰几乎每个月都在网上喊累

岁月有情1314
2026-03-26 12:13:10
张雪峰员工:办公室已拆掉红色锦旗,员工彻夜难眠,家长电话打爆

张雪峰员工:办公室已拆掉红色锦旗,员工彻夜难眠,家长电话打爆

每日人物
2026-03-26 13:34:51
坚决反对中国任何城市申办奥运会,国际奥委会这次怕是真失算了

坚决反对中国任何城市申办奥运会,国际奥委会这次怕是真失算了

南权先生
2026-03-25 15:25:11
砸6700亿建雄安,面积抵3个纽约,如今究竟咋样了?

砸6700亿建雄安,面积抵3个纽约,如今究竟咋样了?

娱乐圈的笔娱君
2026-03-26 12:15:32
盲目的大学扩招,正在反噬整个社会

盲目的大学扩招,正在反噬整个社会

凡人志
2026-03-25 01:34:53
跌麻了!笔记本开年销量暴跌40%近乎腰斩:没人买了

跌麻了!笔记本开年销量暴跌40%近乎腰斩:没人买了

中国能源网
2026-03-26 14:13:04
联大通过决议,宣布“最严重反人类罪”

联大通过决议,宣布“最严重反人类罪”

澎湃新闻
2026-03-26 11:03:06
2026-03-27 03:00:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11443文章数 117016关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

艺术
手机
本地
旅游
公开课

艺术要闻

北京大兴机场和青岛胶东机场“撞脸”,长得像就是抄袭?

手机要闻

1499 iQOO Z11系列发布丨9020mAh电池 165Hz高刷

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

旅游要闻

河南开封万岁山武侠城,游客买300元门票:给妻子拍照被保安阻拦

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版