微软发布Harrier系列嵌AI模型，MTEB-v2基准测试超越谷歌夺冠|向量|上下文|电子表格|知名企业|嵌ai模型|Google|harrier

微软发布Harrier系列嵌AI模型，MTEB-v2基准测试超越谷歌夺冠

2026-04-09 08:14:00　来源: IT之家

山东举报

分享至

IT之家 4 月 9 日消息，微软必应（Bing）团队于 4 月 7 日发布博文，宣布为满足现代 AI 智能体系统对信息处理的高标准需求，开源推出业界领先的文本嵌入模型系列 Harrier，该模型在多语言 MTEB-v2 基准测试中排名第一。

IT之家注：嵌入模型是一种将文本、图像等高维数据转换为低维向量表示的技术，捕捉数据的语义特征，让相似内容在向量空间中距离更近。

在 AI 领域，它是搜索引擎、推荐系统和智能体进行信息检索、语义理解和知识推理的基础组件，直接决定了系统处理信息的质量与效率。

针对 AI 系统从单纯问答向执行操作转变过程中的“落地”难题，微软 Harrier 系列模型进一步提升嵌入质量，显著提升首次检索的事实准确率，降低系统延迟与成本，并有效减少模型幻觉，从而增强用户信任。

此次发布的 Harrier 系列包含三个版本：Harrier-OSS-v1-27B、Harrier-OSS-v1-0.6B 和 Harrier-OSS-v1-270M。所有型号均支持超过 100 种语言，具备 32k 上下文窗口，并能为任意输入生成固定尺寸的嵌入向量。

技术实现上，团队构建了可扩展的数据管道，利用 GPT-5 生成了超 20 亿个弱监督数据样本用于对比预训练，以及超 1000 万个高质量样本用于微调。

在训练策略上，团队为适配低端设备的部署需求，基于 E5 及 GritLM 等前期成果，在旗舰模型训练完成后，通过知识蒸馏技术推出了 Harrier-OSS-v1-0.6b 与 Harrier-OSS-v1-270m 两个轻量级版本。

在权威的多语言 MTEB-v2 基准测试中，Harrier 模型成功超越谷歌 Gemini Embedding 2，位列行业第一。

与竞品相比，Harrier 模型不仅性能优异，更采用完全开源策略。开发者可在无许可限制的情况下使用该模型，从而轻松提升 AI 应用的检索质量与语义理解能力。

基于 Harrier 的技术积累，微软正开发全新的检索服务。该服务将提供更优质的检索质量、更强的语义理解能力以及更稳健的上下文选择，未来将率先应用于必应搜索，以提升用户交互体验。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

汽车要闻

手机 / 数码

房产 / 家居

微软发布Harrier系列嵌AI模型，MTEB-v2基准测试超越谷歌夺冠

Anthropic最强模型被禁，传亚马逊通风报信

金价跌至900元关口 北京大妈豪掷11万给儿媳备五金

金价跌至900元关口 北京大妈豪掷11万给儿媳备五金

8年8队夺冠，邓肯那句话，现在还给了马刺

邓超携子观战NBA，等等帅气十足

金价跌至900元关口，大妈又来抄底了！

综合续航超1600km/零百加速4秒级 2027款星途ES预售18.99万起

态度原创

三星拟为宽折叠机型引入与传闻中 iPhone Fold 类似技术 以降低折痕、提升耐用性

AK刘彰邂逅河北南大港湿地

世界杯的“头”等大事，来了

携手生态伙伴共谱新篇 HDC 2026鸿蒙电脑开启新征程

金价跌至900元关口北京大妈豪掷11万给儿媳备五金

金价跌至900元关口北京大妈豪掷11万给儿媳备五金

三星拟为宽折叠机型引入与传闻中 iPhone Fold 类似技术以降低折痕、提升耐用性