网易首页 > 网易号 > 正文 申请入驻

嵌入模型榜单大洗牌:谷歌登顶,阿里开源方案紧追不舍

0
分享至

谷歌正式将其新的高性能Gemini嵌入模型推向正式商用,目前在备受推崇的大规模文本嵌入基准测试(MTEB)中排名第一。该模型(gemini-embedding-001)现已成为Gemini API和Vertex AI的核心组成部分,使开发者能够构建语义搜索和检索增强生成(RAG)等应用。

虽然第一名的排名标志着强势亮相,但嵌入模型市场竞争异常激烈。谷歌的专有模型正面临强大开源替代方案的直接挑战。这为企业带来了新的战略选择:采用排名第一的专有模型,还是选择性能接近但提供更多控制权的开源挑战者。

谷歌Gemini嵌入模型的核心技术

从本质上讲,嵌入技术将文本(或其他数据类型)转换为数值列表,捕获输入的关键特征。具有相似语义含义的数据在数值空间中的嵌入值更接近。这使得强大的应用超越了简单的关键词匹配,例如构建智能检索增强生成(RAG)系统,为大语言模型提供相关信息。

嵌入技术还可以应用于图像、视频和音频等其他模态。例如,电商公司可能利用多模态嵌入模型为产品生成统一的数值表示,同时融合文本描述和图像信息。

对于企业而言,嵌入模型可以驱动更精确的内部搜索引擎、复杂的文档聚类、分类任务、情感分析和异常检测。嵌入技术也正成为智能体应用的重要组成部分,AI智能体需要检索和匹配不同类型的文档和提示。

Gemini嵌入模型的关键特性之一是其内置的灵活性。它通过俄罗斯套娃表示学习(MRL)技术进行训练,允许开发者获得高度详细的3072维嵌入,同时也可以截断为1536或768等较小尺寸,同时保留最相关的特征。这种灵活性使企业能够在模型准确性、性能和存储成本之间取得平衡,这对于高效扩展应用至关重要。

谷歌将Gemini嵌入模型定位为统一模型,设计为在金融、法律和工程等不同领域"开箱即用",无需微调。这为需要通用解决方案的团队简化了开发流程。该模型支持100多种语言,定价具有竞争力,每百万输入Token收费0.15美元,旨在实现广泛的可访问性。

专有模型与开源挑战者的竞争格局

MTEB排行榜显示,虽然Gemini领先,但差距很小。它面临着OpenAI等成熟模型的挑战,OpenAI的嵌入模型被广泛使用,还有Mistral等专业化挑战者,后者提供专门针对代码检索的模型。这些专业化模型的出现表明,对于某些特定任务,针对性工具可能优于通用工具。

另一个关键参与者Cohere直接瞄准企业市场,推出Embed 4模型。虽然其他模型在通用基准测试中竞争,Cohere强调其模型处理企业文档中常见"噪音现实世界数据"的能力,如拼写错误、格式问题,甚至扫描的手写内容。它还提供虚拟私有云或本地部署,为金融和医疗等受监管行业提供了直接吸引力的数据安全水平。

对专有模型主导地位最直接的威胁来自开源社区。阿里巴巴的Qwen3-Embedding模型在MTEB上仅次于Gemini,并采用宽松的Apache 2.0许可证(可用于商业目的)。对于专注于软件开发的企业,Qodo的Qodo-Embed-1-1.5B提供了另一个令人瞩目的开源替代方案,专门为代码设计,声称在特定领域基准测试中优于更大的模型。

对于已经基于Google Cloud和Gemini模型系列构建的公司,采用原生嵌入模型可以带来多项优势,包括无缝集成、简化的MLOps流水线,以及使用顶级通用模型的保证。

然而,Gemini是一个封闭的、仅API的模型。对于优先考虑数据主权、成本控制或在自有基础设施上运行模型能力的企业,现在在Qwen3-Embedding中有了可信的顶级开源选择,或者可以使用特定任务的嵌入模型之一。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
OL正装 vs 清纯JK,怎么选?

OL正装 vs 清纯JK,怎么选?

贵圈真乱
2026-05-25 10:42:08
曹操撩寡妇时说的金句,如今成了约会开场白,男人经常挂在嘴边

曹操撩寡妇时说的金句,如今成了约会开场白,男人经常挂在嘴边

掠影后有感
2026-05-11 11:31:38
《主角》结局大反转!全员改命太暖心,原著的刀全被剧版拔了

《主角》结局大反转!全员改命太暖心,原著的刀全被剧版拔了

怂熊剧场
2026-05-24 06:23:35
以色列虐待强奸国际志愿者的后果来了!法国出手,禁右翼部长入境

以色列虐待强奸国际志愿者的后果来了!法国出手,禁右翼部长入境

致敬明天的太阳
2026-05-25 10:07:59
“加害者”再次被转移,“毒杨梅”荡出一朵新波浪

“加害者”再次被转移,“毒杨梅”荡出一朵新波浪

呦呦鹿鸣
2026-05-24 16:51:26
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
三斗粮引发兵变...

三斗粮引发兵变...

汉周读书
2026-05-22 19:57:02
谈判失败,轮到中方掀桌子,拒绝美军高层访华,中方已定调统一

谈判失败,轮到中方掀桌子,拒绝美军高层访华,中方已定调统一

别吵吵
2026-05-25 08:34:03
国际油价,暴跌!

国际油价,暴跌!

江南晚报
2026-05-25 10:25:53
王鹤棣迎全网骂潮,只因他踩中了大众最讨厌的三个雷区!

王鹤棣迎全网骂潮,只因他踩中了大众最讨厌的三个雷区!

一盅情怀
2026-05-25 09:24:35
33+8+5+3!史上最离谱体毛哨!2比2,天王山之战来了!

33+8+5+3!史上最离谱体毛哨!2比2,天王山之战来了!

左右为篮
2026-05-25 11:07:15
特斯拉FSD入华!月费783元,老车主只能喝汤!

特斯拉FSD入华!月费783元,老车主只能喝汤!

趣味萌宠的日常
2026-05-23 11:46:45
徐帅有三次机遇,如果把握住任何一次,都不会只是“第八元帅”

徐帅有三次机遇,如果把握住任何一次,都不会只是“第八元帅”

旧书卷里的长安
2026-05-24 23:59:26
杜江为母亲庆贺七十大寿,还晒出霍思燕和母亲合照,并配文:我妈这个状态怎么看也不像70啊,另外她和燕燕怎么这么像啊

杜江为母亲庆贺七十大寿,还晒出霍思燕和母亲合照,并配文:我妈这个状态怎么看也不像70啊,另外她和燕燕怎么这么像啊

极目新闻
2026-05-24 18:00:48
美日英德长债利率狂飙!一场全球抽水正在发生,看懂才能自保!

美日英德长债利率狂飙!一场全球抽水正在发生,看懂才能自保!

小白鸽财经
2026-05-24 20:30:03
姚明坐ES9出行?亚洲巨人的难题解决了

姚明坐ES9出行?亚洲巨人的难题解决了

热点科技
2026-05-24 15:01:56
耗资1亿,票房惨淡,上映1天就被判死刑,明星云集的大片惨败出局

耗资1亿,票房惨淡,上映1天就被判死刑,明星云集的大片惨败出局

童叔不飙车
2026-05-25 08:59:25
越是上流人越“下流”?景甜又被爆出猛料,远比私密照抵债更炸裂

越是上流人越“下流”?景甜又被爆出猛料,远比私密照抵债更炸裂

好贤观史记
2026-05-23 16:51:25
热刺危急时刻自保!1-0战胜埃弗顿保级,德泽尔比完成任务

热刺危急时刻自保!1-0战胜埃弗顿保级,德泽尔比完成任务

里芃芃体育
2026-05-25 11:30:17
冰雕连被拍进电影后,新一轮骂战又开始了:我们该怎么打开英雄

冰雕连被拍进电影后,新一轮骂战又开始了:我们该怎么打开英雄

浪子说
2026-05-25 00:55:03
2026-05-25 12:08:49
至顶科技 incentive-icons
至顶科技
科技产业媒体与 AI 产业服务机构
18709文章数 49707关注度
往期回顾 全部

科技要闻

华为发表半导体演进新定律

头条要闻

约2万公里收费高速公路将到期 到期后会否免费受关注

头条要闻

约2万公里收费高速公路将到期 到期后会否免费受关注

体育要闻

如果不好好守门,他可能早就继承家业了

娱乐要闻

洪涛回应歌手淘汰庾澄庆:难以理喻

财经要闻

退市!33年“A股不死鸟”落幕

汽车要闻

国民家轿再上新 帝豪向上系列限时5.59万起

态度原创

教育
时尚
游戏
亲子
房产

教育要闻

直播预告 | 阅读,让乡村教育变好(5月27日,8:40)

伊姐周日热推:电视剧《盛唐奇案》;电视剧《我的王室死对头》......

2000人民币道具免费送 腾讯大作官方"滑跪" 你满意么?

亲子要闻

儿童牙膏乱象调查:违规宣称食品级可吞咽,奥拉氟多为概念性添加

房产要闻

疯狂周末,海口楼市突然爆了!

无障碍浏览 进入关怀版