网易首页 > 网易号 > 正文 申请入驻

拒绝「降智、减配、乱收费」:面向LLM API的可信验证框架

0
分享至



本文作者分别来自新加坡国立大学和加州大学伯克利分校。第一作者郭衍培来自新加坡国立大学,长期关注大语言模型基础设施中的可信性与安全性问题,特别是云端 LLM 服务的可验证性与经济激励风险。指导教师为新加坡国立大学校长青年教授张嘉恒和加州大学伯克利分校 Dawn Song 教授。

大语言模型(LLM)已经成为各类 AI 应用的基础设施,然而,在通过云端 API 便捷接入这些强大模型的同时,此类黑盒服务模式也引发了一个现实的信任危机:如何确保大模型服务提供商真的运行了所承诺的模型,并如实报告实际使用了 Token 数量,以防止潜在的 LLM 服务 “降智、减配、乱收费”?

事实上,围绕 LLM 服务 “降智” 的讨论,已经在国内外多个开发者社区中反复出现,不少用户都报告过模型在使用一段时间后表现明显下滑的现象 [1,2]。与此同时,若服务商出于竞争或策略原因,对特定用户群体提供差异化甚至低质量服务 [3],则会进一步加剧黑盒 AI 服务的信任危机。

针对这一系列问题,研究者们最近提出了一种新的利用可验证计算(Verifiable Computation)来证明推理过程正确性的 LLM 服务审计框架 ——IMMACULATE。 借助该框架,用户能够在完全不暴露模型内部信息的情况下,仅需 1% 的额外开销,就能轻松验证黑盒 LLM API 的执行完整性,以有效检测模型替换、过度量化以及 Token 虚报计费等 LLM 服务违规行为。相关论文与代码已公开。



  • 论文题目:IMMACULATE: A Practical LLM Auditing Framework via Verifiable Computation
  • 论文链接:https://arxiv.org/pdf/2602.22700
  • 代码链接:https://github.com/guo-yanpei/Immaculate

本研究提出了一种面向黑盒 LLM API 的全新审计框架 IMMACULATE。该框架无需访问模型内部结构,也不依赖专用可信硬件,即可检测云服务商是否真实执行了其声称的模型推理过程,并是否如实报告 token 使用量。通过引入 Logit Distance Distribution (LDD) 这一新的统计度量,并结合 随机化审计与可验证计算技术,IMMACULATE 在真实模型上实现了低于 1% 的系统开销,同时能够可靠检测模型替换、过度量化以及 token 过度计费等经济动机型违规行为。

00 背景:当 LLM 成为 API 服务

近年来,大语言模型(LLMs)逐渐成为 AI 应用的重要基础设施。绝大多数用户并不会直接运行模型,而是通过云端 API 服务调用模型能力。例如 OpenAI、Anthropic 和 Google 等公司提供的模型服务,都采用这种模式。

然而,这种黑盒服务模式带来了一个根本性的信任问题:用户无法验证服务提供商是否真正执行了其声称的模型。

从经济角度看,服务商存在动机通过各种方式降低计算成本或增加收费,例如:

  • 模型替换(Model Substitution)

使用更小、更便宜的模型替代宣称的模型

  • 过度量化(Aggressive Quantization)

使用低精度计算降低成本

  • Token 过度计费(Token Overreporting)

报告比实际更多的 token 使用量

这些行为往往仍会产生语义上正确但整体质量较低的结果,因此用户很难通过输出直接检测到异常。事实上,在国内外多个开发者社区中,已有大量用户分享关于 LLM 服务“降智”的经验 [1, 2]:即在订阅服务一段时间后,模型表现明显不如初期。这类现象在技术社区中引发了广泛讨论。

此外,出于竞争或策略性考虑,一些服务提供商还可能对特定用户群体(例如被识别为潜在竞争对手的调用者)提供差异化或低质量服务 [3]。这一行为严重破坏了模型服务的公平性与可信度,并进一步加剧了黑盒 AI 服务的信任问题。

因此,一个关键问题出现了:

如何在不访问模型内部的情况下,验证 LLM API 是否被诚实执行?

01 方法概览:IMMACULATE 审计框架

IMMACULATE 的核心技术基础之一是可验证计算(Verifiable Computation)。可验证计算是一类密码学技术,使服务器能够在不泄露内部计算过程或模型参数的情况下证明计算结果的正确性,从而让用户无需重新执行计算即可验证远程计算。然而,对每一次请求都生成证明的开销非常高。为此,研究团队提出了 IMMACULATE 审计框架,其核心思想是:

无需验证所有请求,只需随机审计少量请求即可检测系统是否存在大规模违规行为。



图 1 IMMACULATE 工作流程:审计单位伪装成普通用户发送随机的请求,并在收到回复后要求提供证明

具体而言,IMMACULATE 的工作流程包括以下步骤:

  1. 用户正常向 LLM API 发送请求
  2. 服务端返回回答与 token 使用量
  3. 审计者随机选择部分请求进行审计
  4. 服务端提供可验证计算证明
  5. 审计者根据统计指标判断执行是否可信

这种设计利用了一个简单但关键的经济事实:

如果服务商希望通过违规行为获取经济收益,就必须在相当比例的请求上进行违规执行。因此,通过随机审计少量请求即可检测系统是否存在违规行为。

02 关键技术:Logit Distance Distribution (LDD)



图 2 在固定所有离散步骤的结果后,整个推理过程完全是连续函数。输出的距离可以衡量模型的准确度

在实际系统中,验证 LLM 推理过程面临一个重要挑战:GPU 推理存在数值非确定性。即使在完全相同的模型和输入下,不同运行之间的浮点误差也可能导致输出略有不同。因此,传统的 “逐位验证计算” 的方法难以直接应用。

更进一步地,大语言模型的推理过程本身包含两类不同的计算步骤:一类是连续计算(continuous computation),例如注意力计算、MLP 和归一化等神经网络算子;另一类是离散决策(discrete decision),例如 token 选择或专家路由。

连续计算在 GPU 上执行时会受到浮点误差与并行调度的影响,因此具有一定的数值非确定性;而离散决策一旦输入确定,其输出是完全确定的。由于生成过程是自回归的,即使连续计算中极小的数值偏差,也可能导致后续离散决策发生变化,从而使整个推理路径发生分叉。这使得传统需要逐步复现完整推理过程的验证方法难以直接应用。

为此,IMMACULATE 利用了这一结构特性:固定离散决策路径,仅比较连续计算的偏差。具体而言,在给定相同离散决策序列的情况下,我们比较部署模型与参考模型在每一步产生的logits 向量之间的距离分布。这一分布被称为Logit Distance Distribution (LDD)。

其核心思想是:不直接验证每一步推理是否完全一致,而是衡量 实际执行模型与参考模型之间的 logit 偏差分布。

如果系统正常运行:

  • logit 偏差只来自数值误差
  • 偏差分布稳定且集中

如果系统存在违规行为,偏差分布会明显扩大或偏移。因此,通过统计LDD 的尾部概率,系统即可识别异常执行行为。

03 实验结果:低成本检测违规行为



图 3 LLaMA3-70B 模型的 TV 距离分布。可以看出,不同推理方式在尾部有十分明显的概率差异

研究团队在多个模型和数据集上评估了 IMMACULATE 的效果。实验结果表明,对单个请求:

  • 模型替换攻击检测率最高超过 90%
  • 量化攻击检测率可达 1%–10%

在随机审计机制下:仅需约3000 次审计请求,即可在高概率下检测到违规行为。

同时,IMMACULATE 的系统开销极低:

  • 在 vLLM 推理引擎下,吞吐影响 < 1%
  • 计算证明仅在极少请求上触发

这表明该框架具备现实部署可行性。

04 总结

IMMACULATE 提出了一种面向黑盒 LLM API 的可验证审计框架。通过结合随机化审计、可验证计算以及新的 Logit Distance Distribution 指标,该方法能够在不访问模型内部、无需可信硬件的情况下检测云端 LLM 服务的执行完整性。

该研究表明,大规模 LLM 服务的透明性与可信度可以通过轻量级审计机制得到显著提升,为未来 AI 基础设施的可信运行提供了一条可行路径。

参考资料:

[1] https://mp.weixin.qq.com/s/cHhdltxUJ3fDka7oR8I06Q

[2] https://mp.weixin.qq.com/s/6JZrbE16k4qmF0pK-kpGRA

[3] https://www.zhihu.com/question/2009482926241382805/answer/2009814668114428352

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一等功臣郭兴福灭门案始末

一等功臣郭兴福灭门案始末

河山历史
2026-07-02 12:02:19
特斯拉中国 6 月卖了超 8.9 万辆 Model 3/Y

特斯拉中国 6 月卖了超 8.9 万辆 Model 3/Y

新浪财经
2026-07-02 22:54:13
47岁曹格,在重庆演唱会上,为了秀肌肉,穿这个硅胶不怕热吗

47岁曹格,在重庆演唱会上,为了秀肌肉,穿这个硅胶不怕热吗

喜欢历史的阿繁
2026-07-03 06:51:49
西安赛格商场坠亡事件,看得人后背发凉

西安赛格商场坠亡事件,看得人后背发凉

葱哥说
2026-07-02 22:06:49
孔德:亚马尔说西班牙才是热门?我会一笑而过

孔德:亚马尔说西班牙才是热门?我会一笑而过

懂球帝
2026-07-03 05:29:21
166:0!韩国投票结果出来了,李在明下令,韩国向菲律宾派兵

166:0!韩国投票结果出来了,李在明下令,韩国向菲律宾派兵

白日追梦人
2026-07-02 14:29:33
Shams:塔里-伊森5年8150万美元重返火箭,该合同为完全保障

Shams:塔里-伊森5年8150万美元重返火箭,该合同为完全保障

懂球帝
2026-07-03 09:46:28
苹果新品官宣:7月4日,正式开售

苹果新品官宣:7月4日,正式开售

科技堡垒
2026-07-02 10:32:36
世界杯英雄泪!魔笛遗憾出局,C罗获评MVP,穿若塔球衣告慰好兄弟

世界杯英雄泪!魔笛遗憾出局,C罗获评MVP,穿若塔球衣告慰好兄弟

小火箭爱体育
2026-07-03 10:05:29
6月新势力销量榜:能骗一个是一个

6月新势力销量榜:能骗一个是一个

华庭讲美食
2026-07-03 03:40:08
1983年,陈云亲自批示:立即枪毙广东县委书记王仲,原因为何?

1983年,陈云亲自批示:立即枪毙广东县委书记王仲,原因为何?

大运河时空
2026-07-03 08:50:03
西安赛格国际购物中心回应一商户负责人坠亡

西安赛格国际购物中心回应一商户负责人坠亡

界面新闻
2026-07-02 20:40:37
壕无人性!不止球技碾压,亚马尔一条蝙蝠侠项链顶普通人十年工资

壕无人性!不止球技碾压,亚马尔一条蝙蝠侠项链顶普通人十年工资

听我说球
2026-07-03 08:02:18
国台办刚发完统一强音,郑丽文便亮出徽章:台湾的未来只能在大陆

国台办刚发完统一强音,郑丽文便亮出徽章:台湾的未来只能在大陆

寻墨阁
2026-07-03 09:53:49
长江:你“禁渔”让我歇十年,我把活化石从地底下刨出来送给你

长江:你“禁渔”让我歇十年,我把活化石从地底下刨出来送给你

启迪你的思维
2026-07-03 04:38:23
森保一:我不知道韩国民众对韩国队的评价如何,他们已经尽力了

森保一:我不知道韩国民众对韩国队的评价如何,他们已经尽力了

懂球帝
2026-07-03 03:11:07
争议!世界杯高科技绝杀莫德里奇!克罗地亚绝平球被取消

争议!世界杯高科技绝杀莫德里奇!克罗地亚绝平球被取消

澜归序
2026-07-03 10:04:17
朱珠一家意大利被偶遇:最高级的老钱风,是活成了自己

朱珠一家意大利被偶遇:最高级的老钱风,是活成了自己

TVB的四小花
2026-07-02 09:13:51
西媒炮轰姆巴佩:拿皇马工资却在世界杯全倾全力,俱乐部明显留力

西媒炮轰姆巴佩:拿皇马工资却在世界杯全倾全力,俱乐部明显留力

童叔不飙车
2026-07-03 01:03:41
蒋雯丽近况曝光!陪91岁老母逛街,儿子又高又胖,打扮低调似大妈

蒋雯丽近况曝光!陪91岁老母逛街,儿子又高又胖,打扮低调似大妈

TVB的四小花
2026-07-03 10:02:29
2026-07-03 12:07:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13421文章数 142686关注度
往期回顾 全部

科技要闻

特斯拉交付超预期7.4万辆,股价却大跌7.5%

头条要闻

牛弹琴:印度哥哥迎来日本小妹妹 这场外交好戏不简单

头条要闻

牛弹琴:印度哥哥迎来日本小妹妹 这场外交好戏不简单

体育要闻

韩国人,为什么恨透了洪明甫?

娱乐要闻

黄晓明深夜约会美女,分手原因曝光

财经要闻

AI“鬼故事”不断,市场开始重估?

汽车要闻

极氪9X五座版官宣,如图!

态度原创

亲子
旅游
艺术
健康
手机

亲子要闻

小杨阿姨带箖箖到公园运动,筱梅北京忙带娃!

旅游要闻

成就旅游友好型城市!汕潮揭民宿打破地域壁垒走向“共享”

艺术要闻

北京夫妻改造亮马河边41㎡婚房:再小的房子,也能变成温暖的家

这4类消化病患者 吃粘食管住嘴

手机要闻

曝三星Galaxy S27 Ultra手机前摄升级1600万、方形传感器

无障碍浏览 进入关怀版