2025年10月发布的一项重要研究,把生成式AI搜索和传统搜索放在一起做了深入对比。
这项研究由德国波鸿鲁尔大学和马克斯・普朗克软件系统研究所联手开展,围绕人们获取信息的方式展开探讨。
![]()
研究不光看两种搜索工具在使用感受上的差别,还重点分析了它们给出答案的质量,甚至对未来搜索技术的发展方向提出了建议。
通过大量测试,研究团队发现了不少值得关注的现象,这些发现不仅能帮普通人搞懂两种搜索的不同,也给相关领域的开发者和研究者提供了有价值的参考。
用户体验
这项由德国波鸿鲁尔大学和马克斯・普朗克软件系统研究所联合开展的测试中,AI搜索引擎让用户不用点开多个链接就能拿到整合好的答案,信息检索效率明显提升。
但这种便利背后藏着隐忧,传统搜索里,用户能清楚看到每个结果的来源网站,还能根据网站的权威性自己做判断。
![]()
可AI搜索把信息筛选的过程全藏在黑箱里,用户只能看到最终答案,根本没法知道这些内容来自哪些地方,更没法自主选择该相信哪个来源。
长期依赖这种方式,用户可能会慢慢失去对信息的辨别和掌控能力。
答案质量
研究团队用数千次查询对比了传统谷歌搜索和四种AI搜索工具的表现。
包括谷歌AI概述、Gemini、GPT-4o搜索版本以及带搜索工具的GPT-4o,查询覆盖常识、政治、科学等六个领域。
![]()
结果发现一个有意思的现象:AI能从更广泛的网站里扒信息,不像传统搜索只盯着热门链接。
但来源多样并没让答案更完整,反而有不少AI系统专挑传统搜索里排不上号的冷门网站当信息源,这种选择偏好很可能影响答案的可信度。
更麻烦的是AI答案的稳定性问题,同样的问题隔两个月再问,得到的回答会差很多。
这是因为AI回答不仅靠训练数据,还受实时网络信息和算法更新影响,而传统搜索结果的变化主要是因为网页内容本身更新了。
不同AI的脾气也不一样,带搜索工具的GPT-4o更爱用自己脑子里的知识,谷歌AI概述和Gemini却总爱去外面找最新信息,这种策略差异会直接导致同一问题出现不同答案。
![]()
比如查询“什么是不平等的例子?”时,不同引擎给出的主题覆盖范围差距明显,从公开的图表能清晰看到各引擎涉及的主题差异。
未来方向
这项发布在arXiv平台、DOI为10.48550/arxiv.2510.11560的研究指出,现在评价搜索好坏的标准已经跟不上AI时代了。
以前只看链接相关度和排序准不准,现在得从完整性、准确性、平衡性等多个维度评估AI生成的答案。
目前已有搜索引擎开始尝试折中方案,既给AI生成的总结答案,又保留传统的链接列表,想在方便和透明之间找平衡。
![]()
这种混合模式被认为是解决当前困境的可行办法。对普通用户来说,搞懂两种搜索的优缺点很重要,用AI搜完最好再用传统方式验证一下。
尤其是专业场景需要精准信息时,传统搜索还是更可靠的选择。
这项研究不光指出了技术短板,更给未来指了路。
怎么让AI搜索既好用又透明可信,是开发者要解决的大问题,而建立适配AI时代的信息质量评估体系,还需要学术界和产业界一起发力。
结语
这项德国联合研究,清晰展现了AI搜索与传统搜索的各自特点。
AI搜索虽提升了信息获取效率,却存在信息来源不透明、答案稳定性不足的问题,传统搜索虽在可信度和可控性上更优,但效率稍逊。
![]()
研究也为未来指明方向,混合搜索模式或成平衡便利与透明的好选择,建立适配AI时代的信息评估体系也很关键。
对用户而言,了解两者优劣,按需选择并交叉验证,才能更好地利用搜索工具,这也是此次研究给普通人最实际的参考。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.