![]()
新智元报道
编辑:LRST
【新智元导读】ChatGPT上线广告、315曝光GEO投毒产业链,AI搜索商业化的隐忧接连浮出水面。龙虾热背后,3000元就能让AI搜索信口开河,离全面「瞎说」还有多远?来自CMU的ICLR 2026论文AutoGEO提供了一种不同的思路:合作式GEO,在提升内容可见度50.99%的同时保持搜索质量不受损。
2026年初,OpenClaw龙虾热席卷科技圈,全民养「虾」的狂欢背后,AI正以前所未有的速度渗透日常生活。与此同时,AI搜索的可信度却在两面夹击下摇摇欲坠。
一方面是平台亲自下场。ChatGPT今年2月正式上线广告,以独立模块出现在AI回答下方。另一方面更野蛮:315晚会曝光,GEO服务商只需3000元起,就能通过批量「投毒」让虚构产品登上AI搜索的推荐位。
当AI搜索既被平台卖广告,又被第三方投毒,用户还能指望它说真话吗?
除了「卖广告」和「投毒」,AI搜索商业化到底有没有第三条路?
来自CMU的ICLR 2026论文AutoGEO给出了答案。
![]()
论文、代码、在线Demo:https://github.com/cxcscmu/AutoGEO
AI搜索商业化的三条路
要理解当前的乱象,先看AI搜索商业化目前出现的三种模式:
第一条路:平台卖广告。OpenAI、Google等平台方在AI回答中直接嵌入广告。这是传统搜索引擎的老路。好处是透明可控,问题是一旦广告影响到回答排序和内容,用户信任就会被侵蚀。
第二条路:对抗式GEO。也就是315曝光的做法。第三方服务商通过在网上批量发布虚假内容「投喂」AI模型,或在文档中注入干扰指令,强行提升特定内容在AI回答中的曝光度。可见度确实上去了,代价是搜索质量下降、虚假信息泛滥。
第三条路:合作式GEO。AutoGEO提出的方案。不靠欺骗,而是系统地理解AI引擎的偏好,帮助优质内容获得更高的可见度,同时维护搜索引擎的回答质量。
三条路的本质区别在于:前两条是零和博弈(平台/服务商获益,用户受损),第三条是正和博弈(内容方、平台、用户三方共赢)。
AutoGEO的论文用数据证明了第三条路的可行。
合作式 vs 对抗式
差距有多大?
先看最直接的对比。论文将AutoGEO与两种对抗式GEO方法(劫持攻击Hijack Attack和投毒攻击Poisoning Attack)做了正面比较。
![]()
AutoGEO与对抗式GEO方法的对比,蓝色标注性能AI搜索效用(GEU)下降
结果非常清晰:
对抗式方法确实提升了可见度,但搜索引擎的回答质量全面下降。表中标色的数值均低于不做任何GEO的基线,意味着这些方法让AI搜索变得更差了。
AutoGEO在大幅提升可见度的同时,搜索质量保持甚至略有改善。
换句话说,315曝光的那类GEO服务商做的事情,学术上已经被证明是「损人利己」:短期能提升曝光,但搜索引擎会因此给出更差的回答。而合作式GEO能做到「利己不损人」。
再看整体性能。论文在三个数据集(通用领域GEO-Bench和Researchy-GEO、电商领域E-commerce)上,对比了AutoGEO与所有已有GEO方法。
![]()
各方法在三个数据集上的GEO性能对比
AutoGEO API相比此前最强的Fluency Optimization方法,最高提升50.99%。即使是成本极低的AutoGEO Mini(推理成本仅为API版的0.71%),也取得了平均20.99%的提升。
更重要的是,论文还专门评估了搜索引擎的实用性:
![]()
在Gemini、GPT、Claude驱动的三大引擎上的GEO性能与搜索引擎实用性GEU
在Gemini、GPT、Claude三大引擎上,AutoGEO的搜索质量指标(精确度、召回率、清晰度、洞察力)全部维持在基线水平甚至略有提升。
可见度大幅提升,搜索质量纹丝不动。这才是合作式GEO的真正含义。
AutoGEO为什么有效?
关键在于「规则」
AutoGEO之所以能做到合作式优化,核心在于它找到了生成式引擎真正偏好的内容特征。
![]()
AutoGEO框架概览
具体做法是:AutoGEO从大量真实的引擎行为数据中,让大模型自动提取偏好规则。流程分四步:对比高可见度和低可见度文档的差异(解释)、提炼核心因素(提取)、跨查询汇总(合并)、去噪留精(过滤)。最终得到一套可解释的规则集。
这套规则有两种使用方式:
AutoGEO API:直接把规则作为提示词注入GPT、Gemini等大模型API,即插即用。
AutoGEO Mini:用规则作为奖励信号,通过强化学习训练Qwen-3-1.7B小模型。部署成本极低,推理成本仅为API版的0.71%,可在CPU上离线运行。
这部分发现对任何关注AI搜索的内容创作者都有参考价值。
![]()
不同引擎和数据集间的规则重叠与迁移性能
发现一:不同AI引擎的偏好大同小异。相同数据集上,Gemini、GPT、Claude三个引擎的偏好规则重叠率在79%到84%之间。这意味着「好内容」的标准在不同AI引擎之间是相通的。
发现二:不同领域的偏好差异很大。通用研究类问题的规则重叠高达88%,但电商领域降到35%。研究领域偏好「深度解释」和「因果分析」,电商领域偏好「可操作的步骤指引」和「模块化信息结构」。
发现三:定制规则始终最优,但通用规则也有效。为特定引擎和领域量身提取的规则效果最好,但即使直接迁移其他引擎的规则,也能显著优于不使用规则的基线。
这些发现给内容创作者一个清晰的信号:与其靠「投毒」这种短期行为博曝光,不如理解AI引擎真正偏好什么,按规则优化内容。后者不仅效果更好,还不会伤害搜索生态。
AI搜索的信任问题
需要「合作」来解
回到开头的问题:卖广告、投毒,AI搜索还能不「瞎说」吗?
如果整个行业都走前两条路(卖广告+对抗式投毒),AI搜索的可信度确实会持续下降。但AutoGEO指出了一种不同的可能性:合作式GEO可以在「显著」提升内容可见度的同时,搜索质量纹丝不动。
这不只是一个学术结论,更是AI搜索生态可持续发展的方向。当3000元就能污染AI搜索的回答时,行业需要的不是更高的围墙,而是更好的规则。正确的GEO不是给AI投毒,而是让优质内容被AI更好地「看见」。
参考资料:
https://github.com/cxcscmu/AutoGEO
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.