网易首页 > 网易号 > 正文 申请入驻

研究发现:AI 搜索引擎更倾向于引用冷门网站信息

0
分享至

IT之家 10 月 28 日消息,自去年谷歌推出饱受诟病的“AI 概览”(AI Overviews)功能以来,公众已普遍意识到:由人工智能驱动的搜索结果,与搜索引擎数十年来提供的传统链接列表存在巨大差异。如今,一项新的研究量化了这种差异,揭示出 AI 搜索引擎倾向于引用那些访问量较低、甚至在传统谷歌搜索的前 100 名结果中都难以出现的网站。


IT之家注意到,在题为《生成式人工智能时代的网络搜索特征分析》("Characterizing Web Search in The Age of Generative AI")的预印本论文中,德国波鸿鲁尔大学(Ruhr University in Bochum)与马克斯・普朗克软件系统研究所(Max Planck Institute for Software Systems)的研究人员将谷歌传统搜索结果与其 AI 概览(AI Overviews)、Gemini 2.5-Flash 进行对比,并纳入了 GPT-4o 的网页搜索模式以及“GPT-4o 搭配搜索工具”(即仅在大语言模型判断需要外部信息时才调用网络搜索)的表现。

研究人员从多个来源选取测试查询语句,包括“WildChat”数据集中用户向 ChatGPT 提出的具体问题、AllSides 平台上列出的政治议题,以及亚马逊上被搜索次数最多的 100 种商品。

研究发现,生成式 AI 搜索工具所引用的信息来源,其所在网站的受欢迎程度往往低于传统搜索前 10 名的网站,这是根据域名追踪工具 Tranco 的测量结果得出的。相较于传统谷歌搜索结果中的链接,AI 引擎引用的网站更有可能不在 Tranco 统计的全球前 1,000 名或前 1,000,000 名域名之内。其中,Gemini 搜索尤为明显:其引用来源的中位数排名落在 Tranco 前 1,000 名之外,表明其高度依赖不常见的网站资源。

此外,AI 搜索引擎引用的内容往往在相同关键词的传统谷歌搜索结果中几乎不会出现在靠前位置。例如,在谷歌 AI 概览引用的来源中,有 53% 并未出现在对应查询的传统谷歌搜索前十名结果中;更有 40% 的来源甚至未进入前 100 名。

当然,这些差异并不意味着 AI 生成的结果就一定“更差”。研究发现,基于 GPT 的搜索更倾向于引用企业官网和百科类网站作为信息源,而几乎从不引用社交媒体内容。

一项基于大语言模型的分析工具显示,AI 搜索结果所涵盖的可识别“概念”数量,与传统搜索前十条结果相当,说明两者在信息细节、多样性与新颖性方面水平相近。但与此同时,研究人员也指出:“生成式引擎往往会对信息进行压缩,有时会省略次要或模糊的内容,而这些内容在传统搜索结果中仍得以保留。”这一点在面对含义模糊的搜索词(如多名公众人物共用的名字)时尤为突出,此时“传统搜索结果的信息覆盖更为全面”。

另一方面,AI 搜索引擎也有其优势 —— 它们能够将预训练获得的“内部知识”与引用网页中的信息相结合。这一点在“GPT-4o 搭配搜索工具”中表现得尤为明显:该模式常常不提供任何外部引用链接,而是直接基于自身训练数据给出答案。

然而,这种对预训练数据的依赖在查询时效性强的信息时也可能成为短板。当研究人员使用谷歌 9 月 15 日“实时热搜榜”中的关键词进行测试时,发现“GPT-4o 搭配搜索工具”经常回应诸如“您能否提供更多详细信息?”之类的提示,而非主动搜索最新的网络资讯。

尽管研究人员并未最终判定 AI 搜索引擎整体上优于或劣于传统搜索链接,但他们呼吁未来应加强对生成式搜索系统的评估方法研究,强调需综合考虑信息来源的多样性、概念覆盖的完整性,以及信息整合能力等维度,以建立更科学的评价体系。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
佳兆业预告扭亏为盈超500亿,深圳核心项目价值凸显

佳兆业预告扭亏为盈超500亿,深圳核心项目价值凸显

乐居财经官方
2026-03-26 10:14:46
伊朗格斗冠军被捕!或被截肢+判处死刑 曾来中国参赛 击败5大高手

伊朗格斗冠军被捕!或被截肢+判处死刑 曾来中国参赛 击败5大高手

念洲
2026-03-25 17:59:21
Altman发感谢信,16000名被裁程序员集体破防

Altman发感谢信,16000名被裁程序员集体破防

Ping值焦虑
2026-03-25 17:02:40
心跳成为“胜负手”:从张雪峰猝然离世看网球运动员的心脏之殇

心跳成为“胜负手”:从张雪峰猝然离世看网球运动员的心脏之殇

网球之家
2026-03-25 23:38:54
我们看印度人是奇葩,印度人看我们也一样?真相是我们想象的百倍

我们看印度人是奇葩,印度人看我们也一样?真相是我们想象的百倍

番外行
2026-03-24 13:04:28
波兰磨刀:谁将是压垮俄罗斯的最后一根稻草

波兰磨刀:谁将是压垮俄罗斯的最后一根稻草

民间胡扯老哥
2026-03-23 18:56:09
马刺25战23胜冲击雷霆!文班亚马MVP讨论愈演愈烈 美媒预测不看好

马刺25战23胜冲击雷霆!文班亚马MVP讨论愈演愈烈 美媒预测不看好

颜小白的篮球梦
2026-03-26 11:24:41
这就是钱学森后人真实的样貌,女儿定居美国,儿子长孙精忠报国!

这就是钱学森后人真实的样貌,女儿定居美国,儿子长孙精忠报国!

旧史新谭
2026-03-25 13:15:22
骑士不敌热火输在两点:替补太拉胯,季后赛的哈登又回来了

骑士不敌热火输在两点:替补太拉胯,季后赛的哈登又回来了

姜大叔侃球
2026-03-26 11:05:39
黄天鹅就鸡蛋角黄素抽检结果发布声明,三地监管部门抽检结果反馈,鸡蛋未检出角黄素

黄天鹅就鸡蛋角黄素抽检结果发布声明,三地监管部门抽检结果反馈,鸡蛋未检出角黄素

每日经济新闻
2026-03-25 18:11:54
“住宅禁放骨灰盒”新规出炉,引争议!网友:可以去化房地产库存

“住宅禁放骨灰盒”新规出炉,引争议!网友:可以去化房地产库存

火山詩话
2026-03-26 11:11:22
中国最有名的9条家训,读懂一条旺家三代,建议收藏反复背诵

中国最有名的9条家训,读懂一条旺家三代,建议收藏反复背诵

长风文史
2026-03-25 17:58:23
四天619次进攻、6090人伤亡:俄春季攻势为何高伤亡低战果?

四天619次进攻、6090人伤亡:俄春季攻势为何高伤亡低战果?

高博新视野
2026-03-25 08:00:28
禁赛25场!3年1.62亿,乔治正式道歉!

禁赛25场!3年1.62亿,乔治正式道歉!

左右为篮
2026-03-25 12:35:22
刘强东探海游艇制造基地正式落地大连 投资达150亿

刘强东探海游艇制造基地正式落地大连 投资达150亿

CNMO科技
2026-03-26 07:55:12
张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

张雪峰:如果你不好好学习,一旦掉入社会底层,和一群没有素质的人混在一起.....

山东教育
2026-01-27 11:38:18
成都“牵手门”事件女主现今状况曝光,太惨了......

成都“牵手门”事件女主现今状况曝光,太惨了......

许三岁
2026-03-17 07:34:05
伊朗挂断王毅电话后发全球照会,萨勒曼震怒

伊朗挂断王毅电话后发全球照会,萨勒曼震怒

空间展示知识
2026-03-26 07:06:58
全新塞纳实车曝光!2.4T混动+超250马力

全新塞纳实车曝光!2.4T混动+超250马力

沙雕小琳琳
2026-03-26 01:58:11
河南街头用头撞车事件,警方回应后续来了!评论区彻底炸锅

河南街头用头撞车事件,警方回应后续来了!评论区彻底炸锅

奇思妙想草叶君
2026-03-25 13:12:39
2026-03-26 12:32:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
336004文章数 607090关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

36岁男子辞百万年薪工作 在电商卖玩具半年赚了300万

头条要闻

36岁男子辞百万年薪工作 在电商卖玩具半年赚了300万

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

房产
亲子
健康
数码
公开课

房产要闻

质价比标杆!三亚首创浮岛全景舱亮相,还得是万科!

亲子要闻

你娃三岁前已经当够大孝子了

转头就晕的耳石症,能开车上班吗?

数码要闻

戴尔发布MS526C有线鼠标:集成指纹识别 免密码登录Windows

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版