网易首页 > 网易号 > 正文 申请入驻

OpenAI嵌入模型藏了个开关:1536维砍到256维,检索质量几乎不降

0
分享至

你接手了一个向量索引系统。600万个文本块,用text-embedding-3-small生成1536维向量,HNSW图索引吃掉40GB内存,pgvector实例频繁换页,每次批量导入租户数据时p99查询延迟就往上飘。账单还能接受,基础设施快扛不住了。

同事甩给你一篇OpenAI的新嵌入模型博客,里面藏着一段容易被忽略的话:第三代模型支持截断。你可以直接请求256维向量,或者把已有的1536维向量砍掉前256个浮点数。按OpenAI的说法,MTEB上的检索质量几乎不动,索引体积直接缩到1/6,ANN搜索变快——每次距离计算只碰六分之一的内存。


听起来像白捡的优化。有时候确实是。有时候不是,而且失败模式很隐蔽:长尾用户突然反馈"什么都搜不到了",你才知道出事了。

关键要理解Matryoshka表示学习。Kusupati等人的原始论文训练嵌入模型时,让每个输出向量的前缀本身就是可用嵌入。前64维能用,质量低;128维更清晰;256维继续提升;1536维是完整向量。模型在训练阶段就把这个特性 baked in,不是事后加工。

这和事后做PCA完全不同。PCA要在特定语料上拟合,找到最大方差方向,然后旋转嵌入让前k个轴承载最多信号。它有效,但需要代表性数据做拟合步骤,投影质量取决于拟合语料。Matryoshka在训练时就内建了同样的属性,无需拟合,截断前k个浮点数就是全部操作。

OpenAI的text-embedding-3-small(原生1536维,可截断)和text-embedding-3-large(原生3072维,可截断)都是这么设计的。Cohere的Embed v4也支持,提供1536和256两种宽度。Voyage的voyage-3-lite文档显示原生512维。但老模型不一样:text-embedding-ada-002、原始BGE检查点、MiniLM都不是Matryoshka训练出来的,截断它们只会产生损坏向量,不是更小的嵌入。这些得用PCA。

一个笔记本就能跑的小实验:拉取公开检索数据集(BEIR的NFCorpus、FiQA、SciFact不错,覆盖三种不同领域形态),用text-embedding-3-small嵌入所有段落和查询,在四个截断宽度(1536、768、512、256)上评估nDCG@10和recall@10。再用Matryoshka-aware的开源模型(nomic-embed-text-v1.5或bge-m3)做同样的事。

你会看到的典型形状,和OpenAI帖子报告的MTEB结果一致:text-embedding-3-small在FiQA风格检索上,1536维recall@10为0.640、nDCG@10为0.503;砍到768维,两个指标分别降到0.633和0.498,跌幅1%;512维是0.625和0.491,跌2%;256维是0.604和0.474。曲线平缓,但256维确实开始明显下滑。

什么时候截断安全?当你的查询分布和MTEB评测集类似,且对长尾召回的容忍度较高。什么时候PCA仍值得做?当你有领域特定的代表性语料,且愿意承担拟合和投影的运维成本。怎么在上线前判断?看recall曲线,别只看平均数,要看你业务关心的那个分位点。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
放假喜讯传来!2026年中小学暑假时间确定,最长足足70天!

放假喜讯传来!2026年中小学暑假时间确定,最长足足70天!

牛锅巴小钒
2026-05-11 12:59:36
释永信被一女子爆料:她们姐妹住少林寺3天,争着往释永信房间跑

释永信被一女子爆料:她们姐妹住少林寺3天,争着往释永信房间跑

江山挥笔
2026-03-23 15:40:31
全职爸爸靠帅脸火了,全网却为他的“豪门婚姻”吵翻了

全职爸爸靠帅脸火了,全网却为他的“豪门婚姻”吵翻了

妈咪OK
2026-05-08 19:54:01
未来3年贵人追着送钱的生肖:存款滚雪球,一年更比一年好!

未来3年贵人追着送钱的生肖:存款滚雪球,一年更比一年好!

毅谈生肖
2026-05-11 11:10:19
11年前优衣库男女主现状曝光,他们还在一起生了两个孩子

11年前优衣库男女主现状曝光,他们还在一起生了两个孩子

半糖甜而不腻
2026-04-06 12:09:15
推迟发布iPhone18,苹果用iPhone17锁死安卓高端?

推迟发布iPhone18,苹果用iPhone17锁死安卓高端?

互联网放大镜
2026-05-11 10:16:55
人民日报痛批大学生 “沉睡” 现象:躺平四年,毕业真的会失业!

人民日报痛批大学生 “沉睡” 现象:躺平四年,毕业真的会失业!

复转这些年
2026-03-25 10:02:32
生活由普京担保,来中国疗养,叶利钦人生中最后那8年过得怎样?

生活由普京担保,来中国疗养,叶利钦人生中最后那8年过得怎样?

云霄纪史观
2026-04-25 20:20:46
英超最新积分榜:维拉掉链子,阿森纳惊险绝杀,曼城夺冠希望渺茫

英超最新积分榜:维拉掉链子,阿森纳惊险绝杀,曼城夺冠希望渺茫

足球狗说
2026-05-11 06:19:33
爽,张本智和被日媒点名!“数典忘祖”的人,多忠心,也是笑谈

爽,张本智和被日媒点名!“数典忘祖”的人,多忠心,也是笑谈

开成运动会
2026-05-11 12:13:43
旺铺是演的,流水是假的,这些加盟骗局专坑普通人?

旺铺是演的,流水是假的,这些加盟骗局专坑普通人?

世界圈
2026-05-10 08:45:37
韦东奕形象大变,简直像换了个人!韦神包换了,头发少了,老了许多,变的洋气了不少!

韦东奕形象大变,简直像换了个人!韦神包换了,头发少了,老了许多,变的洋气了不少!

白宸侃片
2026-05-08 12:09:25
貔貅认主不看财富,这四个生肖千万别碰,戴了反而会破财

貔貅认主不看财富,这四个生肖千万别碰,戴了反而会破财

纸鸢奇谭
2026-04-13 16:06:54
高市早苗好狠:赶在特朗普访华前,给了他一刀,连中国都没想到!

高市早苗好狠:赶在特朗普访华前,给了他一刀,连中国都没想到!

动漫里的童话
2026-05-11 09:47:26
45岁才明白:微信上基本不发朋友圈的,十有八九是这两种人

45岁才明白:微信上基本不发朋友圈的,十有八九是这两种人

心理观察局
2026-05-08 09:43:07
张本智和又食言了!赛前:彻底清算一定夺金!输球后目光呆滞!

张本智和又食言了!赛前:彻底清算一定夺金!输球后目光呆滞!

篮球资讯达人
2026-05-11 02:34:50
全国政协委员:建议机关事业单位职工双休日调整为“隔周三休”!

全国政协委员:建议机关事业单位职工双休日调整为“隔周三休”!

职场资深秘书
2026-05-10 16:17:06
央视主持人朱迅:生命终将结束,为何不勇敢面对生命的终点呢?

央视主持人朱迅:生命终将结束,为何不勇敢面对生命的终点呢?

标体
2026-05-11 11:36:14
明十三陵被挖后,怪异之事接连不断地发生,至今都无法合理解释

明十三陵被挖后,怪异之事接连不断地发生,至今都无法合理解释

派大鑫
2026-05-11 07:51:27
公安局交管大队队长被举报在KTV违规饮酒与女性举止亲密?当事人:喝茶水,涉事女士突然过来,我下意识推开

公安局交管大队队长被举报在KTV违规饮酒与女性举止亲密?当事人:喝茶水,涉事女士突然过来,我下意识推开

观威海
2026-05-11 09:30:04
2026-05-11 15:39:00
灰度测试中
灰度测试中
生活正在重构,目前还在灰度测试阶段,暂不全量发布。
2465文章数 24关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

媒体:中美元首即将北京会晤 美方一细节耐人寻味

头条要闻

媒体:中美元首即将北京会晤 美方一细节耐人寻味

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

“孕妇坠崖案”王暖暖称被霸凌协商解约

财经要闻

"手搓汽车"曝光:伪造证件、电池以旧代新

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

健康
教育
数码
手机
旅游

干细胞能让人“返老还童”吗

教育要闻

鸡娃放养,都不如养个“晨型人格”的孩子,他会自信又自律

数码要闻

努比亚推出GT Buds耳机:支持35dB降噪,269元

手机要闻

华为Mate 80系列卖爆:销量逼近600万大关 史上最火Mate实至名归

旅游要闻

四川西昌蓝花楹盛放 紫色花海点亮城市

无障碍浏览 进入关怀版