向量数据库迎劲敌?AWS S3 Vectors成本降90%
向量数据库在人工智能发展初期成为核心技术基础,而随着大型自然语言模型(LLM)的普及,向量作为其数据的数值表示,已逐渐成为数据库中的常规数据类型,并发展出一种类型的数据库——向量数据库。
如今,亚马逊云服务(AWS)推出Amazon S3 Vectors,为云对象存储注入原生向量存储与相似性搜索能力,再度改写行业格局。
Amazon S3作为AWS旗下广泛应用的云对象存储服务,是数据湖与湖屋部署的核心组件。此次新增的S3 Vectors功能,允许用户直接在S3中存储向量嵌入,无需迁移至专用基础设施向量数据库,即可支持语义搜索、检索增强生成(RAG)及AI代理工作流。
AWS宣称,该服务相比专业向量数据库解决方案,可将存储与查询的总成本降低高达90%。
那么,S3 Vectors能否真正替代专业向量数据库呢?
![]()
1. 从预览到通用,S3 Vectors为何受青睐?
Amazon S3 Vectors于今年7月首次推出预览版,初始单一索引容量为5000万个向量;在通用可用版本(GA)发布后,这一容量大幅提升至20亿个,单个S3存储桶最高可支持20万亿个向量。
预览版发布后的4个月内,客户已创建超25万个向量索引,导入向量总量突破400亿个。
通用版的规模升级,让企业得以将全量向量数据集整合至单一索引,无需分散部署。同时,AWS根据预览期收集的客户反馈,优化了核心性能:频繁查询延迟降至100毫秒以内,稀有查询1秒内可完成;最大搜索结果数从30个提升至100个,单向量更新支持每秒最多1000次PUT交易。
目前,S3 Vectors的核心用例包括混合搜索、代理内存扩展及现有数据语义层创建。例如预览客户March Networks借助该服务,实现大规模视频与照片的智能处理,既经济存储了数十亿向量嵌入数据,又通过与亚马逊Bedrock的内置集成,轻松融入生成式AI工作流。
2. S3 Vectors能取代专业向量数据库吗?
首先AWS S3 Vectors的定位是互补而非替代。
尽管S3 Vectors具备强大的向量处理能力,但AWS明确将其定位为互补存储层,而非专业向量数据库的直接替代品。两者的选择核心取决于应用对延迟的需求,可通过“性能分级”明确边界:
若应用需超快响应(如实时交互场景),Amazon OpenSearch等专业向量数据库仍是最优选择;
若用于语义层创建、代理内存扩展等对延迟容忍度较高的场景,S3 Vectors凭借成本优势更具适配性。
这一逻辑与数据湖的应用模式相似:企业会继续使用Amazon Aurora等事务数据库处理核心业务负载,同时借助S3的耐用性、可扩展性与成本经济性,承担存储与分析任务,向量存储的发展也将遵循这一“分层协作”路径。
其次,向量数据库厂商认为两者性能差距显著。
专业向量数据库提供商如Pinecone、Weaviate、Qdrant、Chroma等指出,其专业的向量数据库产品与S3 Vectors的“存储为中心”模式存在本质性能差距。这些厂商通过先进索引算法、实时更新及延迟敏感优化,已形成成熟的生产级部署能力。
Pinecone产品副总裁Jeff Zhu表示,该公司早在S3 Vectors推出前便已知晓相关项目,并不认为其在大规模场景下具备直接成本效益。例如某大型电商客户使用Pinecone处理14亿向量的推荐场景,实现了p50=26毫秒、p99=60毫秒的低延迟,且每秒查询量(QPS)达5700万,这是S3 Vectors当前难以企及的。
3. 分析师分歧:向量存储的未来是功能还是产品?
S3 Vectors的发布重新引发行业争论:向量搜索究竟是独立产品类别,还是将被云平台整合为标准化功能?
Constellation Research分析师Holger Mueller认为,S3 Vectors已对独立向量数据库供应商构成竞争威胁,向量本质上是一种“功能”而非“产品”。AWS的核心优势在于消除数据流动成本——S3已存储大量企业数据,原生向量支持无需额外数据迁移,这一特性深受CxO群体青睐。
而Gartner杰出副总裁分析师Ed Anderson则持折中观点:AWS将通过S3 Vectors实现业务增长,提升客户对S3的依赖度,甚至可能让部分企业放弃专用向量数据库,但这并不意味着向量数据库的终结。对于低延迟、高性能需求场景,专业向量数据库仍不可或缺。
AWS自身也认可这种互补关系,并表示将持续优化S3 Vectors的规模与性能。正如AWS相关负责人所言:“我们对S3 Vectors的开发才刚刚起步,就像优化视频和Parquet文件的读写性能一样,我们也会持续提升向量数据的处理能力。”
4. 企业如何选择?基于性能分级的向量存储部署
面对两种技术路径,企业架构师的核心决策依据是工作负载的性能需求,可采用“分层部署”或“混合模式”:
S3 Vectors适用场景:容忍100毫秒延迟的工作负载,包括大型文档语义搜索、代理内存系统、向量嵌入批处理分析、后台RAG上下文检索等。对于已深度应用AWS基础设施的企业,其大规模场景下的成本优势极具吸引力。
专业向量数据库适用场景:延迟敏感型应用,包括实时推荐引擎、高吞吐量并发查询(每秒数千条)、用户交互式应用(需同步等待结果)、性能优先级高于成本的核心业务负载。
混合模式:对于同时存在两种工作负载的企业,可参考数据湖的应用逻辑——用专业向量数据库处理性能关键型查询,用S3 Vectors承担大规模存储与非实时任务。
核心结论并非“是否替换现有基础设施”,而是“如何根据工作负载需求,跨性能层级设计向量存储架构”,实现成本与性能的最优平衡。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.