检索增强生成(RAG)系统面临一个经典难题:向量搜索擅长语义匹配,却容易漏掉精确的关键词;传统关键词搜索相反,能命中特定术语,却理解不了同义词。
混合搜索(Hybrid Search)把两者打包——向量检索+关键词检索并行跑,结果合并。但合并只是第一步,真正决定输出质量的是重排序(Re-Ranking)。
![]()
生产环境的痛点在于延迟。两路检索已经 doubling 了调用成本,如果再用大模型做重排,响应时间直接爆炸。业界的折中方案是用轻量级的交叉编码器(Cross-Encoder)替代生成模型,在精度和速度之间找平衡点。
![]()
另一个隐藏成本是索引维护。混合搜索意味着要同时维护向量库和倒排索引,数据更新时的同步策略、版本回滚、灰度验证,都是工程团队要啃的硬骨头。
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.