网易首页 > 网易号 > 正文 申请入驻

拒绝「降智、减配、乱收费」:面向LLM API的可信验证框架

0
分享至



本文作者分别来自新加坡国立大学和加州大学伯克利分校。第一作者郭衍培来自新加坡国立大学,长期关注大语言模型基础设施中的可信性与安全性问题,特别是云端 LLM 服务的可验证性与经济激励风险。指导教师为新加坡国立大学校长青年教授张嘉恒和加州大学伯克利分校 Dawn Song 教授。

大语言模型(LLM)已经成为各类 AI 应用的基础设施,然而,在通过云端 API 便捷接入这些强大模型的同时,此类黑盒服务模式也引发了一个现实的信任危机:如何确保大模型服务提供商真的运行了所承诺的模型,并如实报告实际使用了 Token 数量,以防止潜在的 LLM 服务 “降智、减配、乱收费”?

事实上,围绕 LLM 服务 “降智” 的讨论,已经在国内外多个开发者社区中反复出现,不少用户都报告过模型在使用一段时间后表现明显下滑的现象 [1,2]。与此同时,若服务商出于竞争或策略原因,对特定用户群体提供差异化甚至低质量服务 [3],则会进一步加剧黑盒 AI 服务的信任危机。

针对这一系列问题,研究者们最近提出了一种新的利用可验证计算(Verifiable Computation)来证明推理过程正确性的 LLM 服务审计框架 ——IMMACULATE。 借助该框架,用户能够在完全不暴露模型内部信息的情况下,仅需 1% 的额外开销,就能轻松验证黑盒 LLM API 的执行完整性,以有效检测模型替换、过度量化以及 Token 虚报计费等 LLM 服务违规行为。相关论文与代码已公开。



  • 论文题目:IMMACULATE: A Practical LLM Auditing Framework via Verifiable Computation
  • 论文链接:https://arxiv.org/pdf/2602.22700
  • 代码链接:https://github.com/guo-yanpei/Immaculate

本研究提出了一种面向黑盒 LLM API 的全新审计框架 IMMACULATE。该框架无需访问模型内部结构,也不依赖专用可信硬件,即可检测云服务商是否真实执行了其声称的模型推理过程,并是否如实报告 token 使用量。通过引入 Logit Distance Distribution (LDD) 这一新的统计度量,并结合 随机化审计与可验证计算技术,IMMACULATE 在真实模型上实现了低于 1% 的系统开销,同时能够可靠检测模型替换、过度量化以及 token 过度计费等经济动机型违规行为。

00 背景:当 LLM 成为 API 服务

近年来,大语言模型(LLMs)逐渐成为 AI 应用的重要基础设施。绝大多数用户并不会直接运行模型,而是通过云端 API 服务调用模型能力。例如 OpenAI、Anthropic 和 Google 等公司提供的模型服务,都采用这种模式。

然而,这种黑盒服务模式带来了一个根本性的信任问题:用户无法验证服务提供商是否真正执行了其声称的模型。

从经济角度看,服务商存在动机通过各种方式降低计算成本或增加收费,例如:

  • 模型替换(Model Substitution)

使用更小、更便宜的模型替代宣称的模型

  • 过度量化(Aggressive Quantization)

使用低精度计算降低成本

  • Token 过度计费(Token Overreporting)

报告比实际更多的 token 使用量

这些行为往往仍会产生语义上正确但整体质量较低的结果,因此用户很难通过输出直接检测到异常。事实上,在国内外多个开发者社区中,已有大量用户分享关于 LLM 服务“降智”的经验 [1, 2]:即在订阅服务一段时间后,模型表现明显不如初期。这类现象在技术社区中引发了广泛讨论。

此外,出于竞争或策略性考虑,一些服务提供商还可能对特定用户群体(例如被识别为潜在竞争对手的调用者)提供差异化或低质量服务 [3]。这一行为严重破坏了模型服务的公平性与可信度,并进一步加剧了黑盒 AI 服务的信任问题。

因此,一个关键问题出现了:

如何在不访问模型内部的情况下,验证 LLM API 是否被诚实执行?

01 方法概览:IMMACULATE 审计框架

IMMACULATE 的核心技术基础之一是可验证计算(Verifiable Computation)。可验证计算是一类密码学技术,使服务器能够在不泄露内部计算过程或模型参数的情况下证明计算结果的正确性,从而让用户无需重新执行计算即可验证远程计算。然而,对每一次请求都生成证明的开销非常高。为此,研究团队提出了 IMMACULATE 审计框架,其核心思想是:

无需验证所有请求,只需随机审计少量请求即可检测系统是否存在大规模违规行为。



图 1 IMMACULATE 工作流程:审计单位伪装成普通用户发送随机的请求,并在收到回复后要求提供证明

具体而言,IMMACULATE 的工作流程包括以下步骤:

  1. 用户正常向 LLM API 发送请求
  2. 服务端返回回答与 token 使用量
  3. 审计者随机选择部分请求进行审计
  4. 服务端提供可验证计算证明
  5. 审计者根据统计指标判断执行是否可信

这种设计利用了一个简单但关键的经济事实:

如果服务商希望通过违规行为获取经济收益,就必须在相当比例的请求上进行违规执行。因此,通过随机审计少量请求即可检测系统是否存在违规行为。

02 关键技术:Logit Distance Distribution (LDD)



图 2 在固定所有离散步骤的结果后,整个推理过程完全是连续函数。输出的距离可以衡量模型的准确度

在实际系统中,验证 LLM 推理过程面临一个重要挑战:GPU 推理存在数值非确定性。即使在完全相同的模型和输入下,不同运行之间的浮点误差也可能导致输出略有不同。因此,传统的 “逐位验证计算” 的方法难以直接应用。

更进一步地,大语言模型的推理过程本身包含两类不同的计算步骤:一类是连续计算(continuous computation),例如注意力计算、MLP 和归一化等神经网络算子;另一类是离散决策(discrete decision),例如 token 选择或专家路由。

连续计算在 GPU 上执行时会受到浮点误差与并行调度的影响,因此具有一定的数值非确定性;而离散决策一旦输入确定,其输出是完全确定的。由于生成过程是自回归的,即使连续计算中极小的数值偏差,也可能导致后续离散决策发生变化,从而使整个推理路径发生分叉。这使得传统需要逐步复现完整推理过程的验证方法难以直接应用。

为此,IMMACULATE 利用了这一结构特性:固定离散决策路径,仅比较连续计算的偏差。具体而言,在给定相同离散决策序列的情况下,我们比较部署模型与参考模型在每一步产生的logits 向量之间的距离分布。这一分布被称为Logit Distance Distribution (LDD)。

其核心思想是:不直接验证每一步推理是否完全一致,而是衡量 实际执行模型与参考模型之间的 logit 偏差分布。

如果系统正常运行:

  • logit 偏差只来自数值误差
  • 偏差分布稳定且集中

如果系统存在违规行为,偏差分布会明显扩大或偏移。因此,通过统计LDD 的尾部概率,系统即可识别异常执行行为。

03 实验结果:低成本检测违规行为



图 3 LLaMA3-70B 模型的 TV 距离分布。可以看出,不同推理方式在尾部有十分明显的概率差异

研究团队在多个模型和数据集上评估了 IMMACULATE 的效果。实验结果表明,对单个请求:

  • 模型替换攻击检测率最高超过 90%
  • 量化攻击检测率可达 1%–10%

在随机审计机制下:仅需约3000 次审计请求,即可在高概率下检测到违规行为。

同时,IMMACULATE 的系统开销极低:

  • 在 vLLM 推理引擎下,吞吐影响 < 1%
  • 计算证明仅在极少请求上触发

这表明该框架具备现实部署可行性。

04 总结

IMMACULATE 提出了一种面向黑盒 LLM API 的可验证审计框架。通过结合随机化审计、可验证计算以及新的 Logit Distance Distribution 指标,该方法能够在不访问模型内部、无需可信硬件的情况下检测云端 LLM 服务的执行完整性。

该研究表明,大规模 LLM 服务的透明性与可信度可以通过轻量级审计机制得到显著提升,为未来 AI 基础设施的可信运行提供了一条可行路径。

参考资料:

[1] https://mp.weixin.qq.com/s/cHhdltxUJ3fDka7oR8I06Q

[2] https://mp.weixin.qq.com/s/6JZrbE16k4qmF0pK-kpGRA

[3] https://www.zhihu.com/question/2009482926241382805/answer/2009814668114428352

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
林诗栋处罚尘埃落定 国际乒联公开力挺 少年不负乒乓荣光

林诗栋处罚尘埃落定 国际乒联公开力挺 少年不负乒乓荣光

乐悠悠娱乐
2026-05-14 15:31:27
中行将关停独立信用卡App,系国有大行首例

中行将关停独立信用卡App,系国有大行首例

看看新闻Knews
2026-05-14 22:28:06
印度举办的金砖峰会,王毅外长不去了,给出的理由新德里只能接受

印度举办的金砖峰会,王毅外长不去了,给出的理由新德里只能接受

牛锅巴小钒
2026-05-15 01:42:27
俄总统新闻秘书:只要美国不再把经贸合作与乌克兰问题挂钩,俄愿同美开展商业往来

俄总统新闻秘书:只要美国不再把经贸合作与乌克兰问题挂钩,俄愿同美开展商业往来

极目新闻
2026-05-14 09:58:58
周总理只是让他去经商,为党赚取经费,他却给组织赚回个商业帝国

周总理只是让他去经商,为党赚取经费,他却给组织赚回个商业帝国

文史达观
2026-04-18 09:29:56
73岁车田正美再执笔,圣斗士星矢天界篇第一话正式登场!

73岁车田正美再执笔,圣斗士星矢天界篇第一话正式登场!

坠入二次元的海洋
2026-05-14 18:04:37
女大十八变,全红婵近照美到认不出,少女感十足,气质温婉又灵动

女大十八变,全红婵近照美到认不出,少女感十足,气质温婉又灵动

黔乡小姊妹
2026-05-15 08:15:14
5月14日,广东队传来3大消息:徐杰表态 萨林杰想降薪 奖金正常发

5月14日,广东队传来3大消息:徐杰表态 萨林杰想降薪 奖金正常发

锅锅爱历史
2026-05-14 14:09:35
不要错过!5月15日早上09:00比赛!中央5套CCTV5、CCTV5+直播表

不要错过!5月15日早上09:00比赛!中央5套CCTV5、CCTV5+直播表

寒律
2026-05-15 06:42:55
刘震云:当你一无所有时,死心塌地跟着你的女人,就是你的贵人

刘震云:当你一无所有时,死心塌地跟着你的女人,就是你的贵人

杏花烟雨江南的碧园
2026-04-29 14:15:03
张本美和真敢说!发布会直言:王曼昱赛场胆怯,出手不果断太犹豫

张本美和真敢说!发布会直言:王曼昱赛场胆怯,出手不果断太犹豫

观鱼听雨
2026-05-14 22:25:52
“十年烧烤无人问,一墙书法天下知!”女孩在父亲店写《将进酒》

“十年烧烤无人问,一墙书法天下知!”女孩在父亲店写《将进酒》

一丝不苟的法律人
2026-05-12 21:58:34
《给阿嬷的情书》总票房破2亿!制片人曾说:“我说票房能过亿,他们觉得我疯了”

《给阿嬷的情书》总票房破2亿!制片人曾说:“我说票房能过亿,他们觉得我疯了”

上观新闻
2026-05-14 12:36:09
特斯拉中国官宣全新优惠,5.59 万即可提 Model 3 了!

特斯拉中国官宣全新优惠,5.59 万即可提 Model 3 了!

XCiOS俱乐部
2026-05-13 14:22:27
吃过大亏才清醒:愚蠢的人逢人就诉苦,聪明的人到处讲道理,而真正通透的人,早已悟透这两条闭嘴天规

吃过大亏才清醒:愚蠢的人逢人就诉苦,聪明的人到处讲道理,而真正通透的人,早已悟透这两条闭嘴天规

心理观察局
2026-05-15 08:30:07
参宿四爆炸后,地球夜空会亮如白昼,至少半年不用开灯了

参宿四爆炸后,地球夜空会亮如白昼,至少半年不用开灯了

观察宇宙
2026-05-13 20:18:32
恭喜!陈思诚又当爹!26岁小女友晒生日照,一脸孕相得到父母认可

恭喜!陈思诚又当爹!26岁小女友晒生日照,一脸孕相得到父母认可

八卦王者
2026-05-14 11:39:43
白宫记者随专机抵京,被解放军军姿震撼拍爆外网,登上头条!

白宫记者随专机抵京,被解放军军姿震撼拍爆外网,登上头条!

大稻网络科技
2026-05-14 09:11:51
女子称丈夫买榴莲时将1万错付成11万,几个月后联系商家退款却被告之已退还,当事人:当时销售知道多付了钱,让财务把钱退到他自己账户了

女子称丈夫买榴莲时将1万错付成11万,几个月后联系商家退款却被告之已退还,当事人:当时销售知道多付了钱,让财务把钱退到他自己账户了

潇湘晨报
2026-05-14 20:45:03
《歌手2026》终版确认:首发9位歌手,2位国际,刘宪华缺席

《歌手2026》终版确认:首发9位歌手,2位国际,刘宪华缺席

音乐钢琴娱乐咖
2026-05-14 11:55:06
2026-05-15 09:08:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12996文章数 142648关注度
往期回顾 全部

科技要闻

两年联姻一地鸡毛,传苹果OpenAI濒临决裂

头条要闻

欢迎宴会座位公开:马斯克黄仁勋与中国企业家同桌吃饭

头条要闻

欢迎宴会座位公开:马斯克黄仁勋与中国企业家同桌吃饭

体育要闻

争议抽象天王山,和季后赛最稳定中锋

娱乐要闻

何九华官宣当爸!全程不提孩子妈

财经要闻

特朗普的北京时刻

汽车要闻

双零重力座椅/AI智能体/调光天幕 启境GT7内饰发布

态度原创

教育
艺术
旅游
数码
军事航空

教育要闻

“体育+数学”“体育+美育”“体育+劳动”……这位老师的体育跨学科教学,有趣又有益!

艺术要闻

花园里,花丛中

旅游要闻

三亚亿恒夜市“五一”期间接待游客超8万人次 助力 “夜经济”增长

数码要闻

雷蛇发布2026款灵刃18游戏本,聚焦细节升级

军事要闻

乌克兰首都基辅遭空袭 死亡人数增至12人

无障碍浏览 进入关怀版