网易首页 > 网易号 > 正文 申请入驻

阿里开源“零搜索”技术,训练成本直降88%,准确度超谷歌搜索

0
分享至

智东西5月9日消息,阿里巴巴5月7日发表于arXiv的论文透露,阿里巴巴达摩院研发的“零搜索”(ZeroSearch)技术突破性破解AI训练成本困境。该技术能通过模拟搜索引擎训练机制,使大模型在无需调用真实搜索引擎API的情况下自主进化检索能力。

“零搜索”技术打破依赖科技巨头的API经济模式,开发者可精准控制训练数据质量。目前开源代码已登陆GitHub和Hugging Face平台,涵盖Qwen-2.5、LLaMA-3.2等主流架构,支持基础版和指令微调版模型。初创企业可用四块A100显卡搭建高精度训练环境。

在包含NQ、TriviaQA、PopQA、HotpotQA等七大主流问答数据集的综合测评中,基于“零搜索”技术训练的140亿参数大模型不仅搜索准确率力压谷歌,更实现训练成本直降近九成。

据VentureBeat今天报道,原本需要调用商业搜索引擎API的586.70美元(折合人民币约为4240.74元)开销,如今仅需70.80美元(折合人民币约为510.17元)即可完成同等量级训练任务。这项创新让AI模型在“自我模拟”(self-simulated)中获得出类似搜索搜索引擎的检索能力。

一、 “零搜索” 技术成本大降超八成,性能超越谷歌搜索

研究人员使用SerpAPI调用谷歌搜索服务作为对照组,通过模拟传统AI训练流程中调用商业搜索引擎API的场景,与“零搜索”技术方案进行成本对比。

研究人员测算,使用SerpAPI调用谷歌搜索处理约6.4万次查询,成本约为586.70美元(约合人民币为4228.82元);而在四块A100 GPU上运行14B参数的大语言模型,仅需70.80美元(折合人民币约为510.43元),节省幅度高达88%。

据TechCrunch 2024年11月报道,从目前存在的一些公开信息透露,SerpAPI旨在帮助开发者绕过复杂的网页解析流程,SerpAPI能通过API调用获取谷歌、Bing、百度等主流搜索引擎的搜索结果数据。

SerpAPI的实际企业用户包括Jasper.ai、Copy.ai等AI初创公司,这些企业通过API接口获取实时搜索结果训练对话系统,但具体成本数据未被披露。

二、阿里大模型能生成拟真文档,较谷歌API节省88%开支

阿里巴巴的研究团队发现,经过海量预训练的大模型已具备拟真文档生成能力。通过监督微调将大语言模型转化为检索模块,能按需生成相关或无关文档组合。

在强化学习阶段,系统通过渐进式降低生成文档质量的“教学方案”,迫使模型持续优化检索精度,形成自主进化闭环。

据VentureBeat今天报道,在TriviaQA等7个主流问答数据集测试中,基于通义千问2.5、LLaMA3.2等架构的模在数学视觉推理测试中得分超过OpenAI o1,展现了强大的图形与数学结合的分析能力。14B参数模型在事实准确性指标上超越谷歌搜索2.3个百分点,7B模型与商业引擎持平。相同训练量下模拟方案较谷歌搜索API节省88%开支。

结语:“零搜索”技术推动AI产业进入低成本自主进化阶段

阿里巴巴达摩院的突破可能是AI训练范式的重要转折。当大模型能在封闭系统内模拟现实世界的信息交互,用户得以摆脱对外部服务的依赖,这对数据安全、训练可控性及技术民主化或具有深远意义。

从行业发展趋势来看,“零搜索”技术有望对AI开发价值链产生深远影响。随着自模拟技术成熟,未来,或将涌现更多AI训练方案,推动产业进入低成本自主进化的新阶段。

来源:arXiv、VentureBeat

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
彭总视察哈军工,晚饭时看到一学员,便问陈赓:他有什么资格坐这

彭总视察哈军工,晚饭时看到一学员,便问陈赓:他有什么资格坐这

鹤羽说个事
2025-11-12 15:50:09
罕见女乒聚餐合影:刘诗雯反差最大,朱雨玲最显眼,陈梦还很青涩

罕见女乒聚餐合影:刘诗雯反差最大,朱雨玲最显眼,陈梦还很青涩

揽星河的笔记
2025-11-13 12:28:04
犯规,汪顺、董亦凡、洪金权、何峻毅无缘决赛

犯规,汪顺、董亦凡、洪金权、何峻毅无缘决赛

极目新闻
2025-11-17 11:12:41
穿衣打扮选择适合自己的肤色和气质的颜色和款式才是最重要的

穿衣打扮选择适合自己的肤色和气质的颜色和款式才是最重要的

牛弹琴123456
2025-11-16 09:52:07
杨翰森21分助湖人胜,数据证明他是关键功臣!

杨翰森21分助湖人胜,数据证明他是关键功臣!

小蒋爱唠嗑
2025-11-17 13:24:03
不许中国改变现状,我方首次明确侵略,敢保台解放军必攻日本土?

不许中国改变现状,我方首次明确侵略,敢保台解放军必攻日本土?

阿芒娱乐说
2025-11-17 12:53:47
26分7板13助,火箭又挖到奇兵!伊森伤情出炉无碍休城5大优势冲冠

26分7板13助,火箭又挖到奇兵!伊森伤情出炉无碍休城5大优势冲冠

锅子篮球
2025-11-16 17:13:24
山西摔狗反杀案,为何检方认为防卫过当?被告律师一语道破真相

山西摔狗反杀案,为何检方认为防卫过当?被告律师一语道破真相

慢半拍sir
2025-11-15 21:23:31
杨兰兰最新:不上课、不社交、英语差,喜欢买买买,香奈儿VVIP

杨兰兰最新:不上课、不社交、英语差,喜欢买买买,香奈儿VVIP

麦大人
2025-10-09 16:23:06
范丞丞又背刺范冰冰!易烊千玺面部出问题了!

范丞丞又背刺范冰冰!易烊千玺面部出问题了!

八卦疯叔
2025-11-17 12:47:43
四川盆地秋日明媚“返场” 最冷时段在18日-19日早上

四川盆地秋日明媚“返场” 最冷时段在18日-19日早上

封面新闻
2025-11-17 13:33:05
中央5台转播全运会乒乓团体赛时间表公布,11月17日赛程一览

中央5台转播全运会乒乓团体赛时间表公布,11月17日赛程一览

阿諢体育
2025-11-17 08:52:41
邓家佳在重庆吃烤鱼被偶遇 小姨妈气质绝了 脸小精致美得恰到好处

邓家佳在重庆吃烤鱼被偶遇 小姨妈气质绝了 脸小精致美得恰到好处

娱圈小愚
2025-11-17 10:30:34
全运会乒乓:马龙连赢2场击败“小马龙”!北京男团强势晋级8强

全运会乒乓:马龙连赢2场击败“小马龙”!北京男团强势晋级8强

全言作品
2025-11-17 12:02:20
葡萄牙队友集体发力劝退C罗 主场9-1横扫亚美尼亚直通2026世界杯

葡萄牙队友集体发力劝退C罗 主场9-1横扫亚美尼亚直通2026世界杯

智道足球
2025-11-17 08:17:53
"万人痛批"宋佳拿影后!成龙,这就是为啥我们不愿去电影院的答案

"万人痛批"宋佳拿影后!成龙,这就是为啥我们不愿去电影院的答案

史行途
2025-11-17 12:23:30
欧美彻底傻眼!中国北重耗时三年,成功攻克世界难题“360工程”!

欧美彻底傻眼!中国北重耗时三年,成功攻克世界难题“360工程”!

趣文说娱
2025-11-14 15:39:41
黄希扬:向余望在国奥遭受巨大质疑,归队后每个人都在鼓励他

黄希扬:向余望在国奥遭受巨大质疑,归队后每个人都在鼓励他

懂球帝
2025-11-17 11:32:22
最应该感谢高市早苗的人是马杜罗,现在美国正对委内瑞拉大兵压境

最应该感谢高市早苗的人是马杜罗,现在美国正对委内瑞拉大兵压境

凌风的世界观
2025-11-17 09:46:08
人均600万到欠400亿,毁掉“天下第一村”的不是别人,是他们自己

人均600万到欠400亿,毁掉“天下第一村”的不是别人,是他们自己

一家说
2025-05-23 15:05:58
2025-11-17 14:47:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
10749文章数 116897关注度
往期回顾 全部

科技要闻

营销话术反噬信任,雷军不该只是一怒了之

头条要闻

媒体:中国开会研究"琉球学" 必须重视这门绝学了

头条要闻

媒体:中国开会研究"琉球学" 必须重视这门绝学了

体育要闻

当家球星受伤后,球迷乐翻了天?

娱乐要闻

二次封后的宋佳凭什么狂妄?

财经要闻

疯狂的"吸金村":村民大肆盗采地下水

汽车要闻

荣威M7+豆包大模型 用车机AI策划说车视频怎么样?

态度原创

旅游
本地
手机
公开课
军事航空

旅游要闻

九寨沟门票连续5天售罄 在红叶彩林间遇见最美四川|我心中的锦绣天府·安逸四川

本地新闻

这档古早综艺,怎么就成了年轻人的哆啦A梦?

手机要闻

余承东换上华为Mate 80 Pro Max!首发麒麟9030+20GB内存

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

安理会将表决加沙问题草案 美以在关键问题上有分歧

无障碍浏览 进入关怀版