网易首页 > 网易号 > 正文 申请入驻

GPT-5.6与Mythos 5,第一代白宫“许可”的模型

0
分享至

GPT-5.6系列模型刚刚发布,它自称是下一代模型,不过真正的意义,是美国政府对前沿大模型的监管,正在进入一个新阶段。

OpenAI这次推出的是一个受限预览版:GPT-5.6 Sol、Terra、Luna三款模型先只开放给一小部分“可信合作伙伴”,而这些参与者名单已经提交给美国政府。与此同时,Anthropic的Mythos 5在被突然叫停之后,又被允许重新部署给部分网络防御机构和关键基础设施运营商;更面向公众和企业通用场景的Fable 5,则仍在与政府商谈重新开放。

这几件事情放在一起看,意义远远超过一次模型发布受阻。美国政府对前沿AI的治理,正在从过去的监管AI公司,转向直接管理模型能力和模型部署,但这一做法也遭到AI治理专家的批评。


(GPT-5.6自称为下一代模型,在一些关键指标上超过Claude Mythos/Fable 5,来源:openai.com)

前沿大模型的战略能力

美国政府最在意的是网络安全能力,尤其是从发现漏洞转向利用漏洞的能力。过去,AI能够辅助写代码、审查代码、解释漏洞,更多被视为生产力工具。但当GPT-5.6、Mythos这类模型能够参与长周期漏洞研究、生成利用链条、协助渗透测试、自动修补或攻击软件系统时,事情性质就变了。对政府来说,这种能力具有天然的双重属性:它可以帮助防御者加速修补开源软件和关键基础设施,也可能帮助攻击者自动化网络攻击。

GPT-5.6的系统卡明确把Sol、Terra、Luna都列为网络安全高能力模型。OpenAI同时强调,它们还没有达到“Cyber Critical”的最高风险等级,因为在测试中模型尚未自主完成针对加固目标的端到端攻击。但政府并不只看当前基准测试,它担心的是,模型如果与工具、脚本、代理框架、浏览器、代码执行环境和外部情报结合,就可能越过单一评测所能覆盖的边界。

第二类能力是生物与化学风险。GPT-5.6同样被OpenAI列为生物与化学领域的高能力模型。这里的担忧是它是否降低非专业人员进入危险实验的门槛,例如帮助设计实验流程、排查湿实验失败、优化合成步骤,或者把分散知识组织成可执行方案。过去需要专业团队、实验经验和大量试错才能完成的危险任务,未来可能被模型压缩为可复制的操作流程。

第三类能力是智能体能力。GPT-5.6的“ultra”模式强调多子智能体协作,Sol在代码、网络安全和长周期任务上都有明显提升。一个接入工具、文件、代码库、网络环境和工作流的智能体,如果能连续数小时甚至数天执行任务,风险就变成了过程性风险。它可能越界调用工具,可能误解用户意图,也可能在复杂目标中采取未经授权的中间步骤。

第四类能力是AI自我改进。OpenAI称GPT-5.6尚未达到其AI 自我优化的高能力门槛;Anthropic也长期关注AI研发自动化和递归自我改进。这说明政府和企业都在关注同一个问题:如果模型不仅能帮助人类写代码,还能显著加速AI研究本身,那么模型就可能成为下一代模型的生产工具。到那时,监管对象不再是一个静态产品,而是一个加速技术前沿移动的生产系统。

第五类风险是外国访问和模型能力外流。Anthropic的Fable 5和Mythos 5被叫停,关键不只是因为某个越狱技巧,而是因为政府把模型能力视为可能被外国军方、情报机构或网络攻击组织利用的能力。美国对“外国人访问”的限制,甚至延伸到了美国境内的外籍员工,这本质上已经接近出口管制中的“视同出口”逻辑:即使技术没有离开美国,只要外国国籍人士获得了访问,也可能被视作敏感能力外流。

从自愿评测,到准入名单,再到出口管制

美国政府目前还没有形成一套成熟、统一、可预测的前沿模型监管制度。它采取的是一组拼接式工具进行敏捷监管。

第一是政府评估正在向预审批演变。特朗普政府6月的AI与网络安全行政令建立了所谓自愿框架,要求前沿模型开发商在更广泛发布之前,把模型提前提供给政府进行能力和安全评估。名义上这是自愿机制,但GPT-5.6的发布显示,它正在迅速变成事实上的预审批机制。

第二是分阶段部署。GPT-5.6没有直接全面发布,而是先给一小部分可信伙伴;Mythos 5也不是恢复公开访问,而是恢复给网络防御组织和基础设施提供商。这种方式类似药品临床、军品许可和关键技术出口之间的混合体:先小范围、可信对象、可监控使用,再视风险扩大开放。

第三是用户名单审查。OpenAI称参与预览的可信伙伴名单已经与政府共享。媒体报道显示,相关部门并非只有一个,而是包括商务部、财政部、白宫国家网络主任办公室、白宫科技政策办公室等。用户名单成为模型治理的新工具:政府不必直接写一条全国性禁令,只要决定哪些客户能先用,哪些客户不能用,就可以控制模型扩散速度。

第四是出口管制。Anthropic事件最具标志性意义的地方,是美国商务部以国家安全和出口管制权力,要求停止外国国籍人士访问Fable 5和Mythos 5。这是把“模型访问”当成受控技术来处理,而不是把模型简单视为互联网服务。由于Anthropic无法实时按国籍筛选全球用户,结果只能关闭两个模型的全部访问。可以预见,今后硅谷的科技公司,可能会对外籍员工进行某种隔离,而外籍人士在硅谷的初创公司,也无法第一时间使用最前沿的大模型。

第五是供应链风险工具。在Anthropic与五角大楼围绕军事用途的争执中,五角大楼将Anthropic列为供应链风险。这说明在国家安全体系里,模型供应商正在被当作关键技术供应链的一环。未来军方、情报机构和关键基础设施运营商采购AI模型时,可能不仅看性能和价格,还要看供应商是否可靠、是否愿意支持“所有合法用途”、是否可能因伦理或政治理由中断服务。

第六是持续监控与可撤回部署。Fable和Mythos事件说明,模型发布不再是终点。模型即使已经上线,也可能因为越狱、能力外泄、外国访问或军事用途争议被政府要求下架、限制或重新许可。美国正在形成一种“部署后监管”模式:模型上线后依然处于政府可重新评估的状态。

OpenAI与Anthropic:同样被监管,不同的政治站位

从表面看,OpenAI和Anthropic都被限制了。GPT-5.6只能对政府认可的少数用户开放,Mythos 5也只能重新开放给少数可信伙伴。但两家公司与政府的关系非常不同。

OpenAI采取的是合作式治理路线。它强调广泛访问,但愿意在短期内配合政府要求,把GPT-5.6先限制在可信合作伙伴范围内。OpenAI的公开表态很微妙:它承认需要与政府合作、需要建立可重复的发布流程,也同时强调这种政府准入程序不应成为长期默认制度。它的基本立场是:企业负责测试、安全栈和分层访问,政府可以参与评估,但不能把前沿模型变成永久审批制产品。

OpenAI自己的安全治理依托就绪框架(Preparedness Framework)。这个框架把高风险能力分成网络安全、生物化学、AI自我改进等类别,用High、Critical等等级来决定是否需要更强安全措施。GPT-5.6认为网络和生物化学达到High,但未达到Critical;AI自我改进尚未达到High。因此可以发布,但必须采用更强的多层防护,包括模型内训练、实时分类器、账户级监控、差异化访问、使用限制和持续红队测试。

Anthropic则是更强的企业伦理边界路线。它的责任的扩展政策(Responsible Scaling Policy)从一开始就是行业里最系统的前沿模型风险框架之一,用AI安全水平(AI Safety Levels)来对应不同能力等级,并要求达到更高能力时升级部署和安全标准。Anthropic更强调公司自身对模型用途的责任,也更愿意设置不可逾越的用途红线。

这种差异在五角大楼争执中表现得最清楚。Anthropic并不否认自己为国防部门提供服务,它也强调Claude可以支持情报分析、模拟、作战规划、网络行动等任务。但它坚持两个例外:不支持完全自主武器,不支持大规模国内监控。Anthropic的说法是,军事作战决策当然应由军方负责,但公司有权对高层用途类别设置边界。

五角大楼和特朗普政府显然不接受这一点。它们更倾向于认为,只要用途合法,政府而不是企业应该拥有最后决定权。这就是OpenAI和Anthropic待遇差异背后的深层原因:OpenAI在政府框架中寻找合作空间,Anthropic试图保留企业对模型用途的最终否决权;前者更像可监管的合作方,后者则被政府视为可能不可靠的关键供应商。

这并不是说OpenAI没有安全政策,也不是说Anthropic反对国家安全。恰恰相反,两家公司都深度参与国家安全叙事。但它们对谁拥有最后控制权的理解不同:OpenAI更愿意接受政府作为最终合法性来源;Anthropic更坚持模型开发者也承担伦理责任。

智能体,一种新型军民两用技术

传统军民两用技术包括芯片、卫星、激光、加密、航空发动机、先进材料。它们的共同特点是民用价值巨大,同时也能增强军事能力。今天的前沿大模型正在进入同一类别,但它比传统军民两用技术更难管理。

原因有三点:

第一,大模型不是一个实物,而是一种可通过API调用的能力。过去出口管制管的是设备、软件包、图纸、芯片、设备和技术资料;现在监管者面对的是一个远程调用的模型服务。能力可以通过云端提供,用户可以在全球任何地方访问,模型还可以被嵌入其他产品和工作流。

第二,大模型的军民边界高度模糊。网络漏洞研究既是防御也是攻击;生物实验设计既可用于药物研发也可用于武器风险;代码智能体既能提升生产力,也能生成恶意工具;军事模拟既可用于防御,也可用于打击规划。同一个能力无法简单按“向善”和“做恶”二分,必须结合用户、场景、权限、工具链和监控体系判断。

第三,大模型能力会快速扩散。今天只有Sol或Mythos具备的能力,几个月后可能出现在更小、更便宜、更开源的模型上。前白宫科技顾问鲍尔(Dean Ball)一语中的:以模型为单位监管很困难,因为模型只是浮点数集合,实验室会不断发布新模型,能力门槛也会因为算法效率提升而迅速变化。监管一个具体模型,可能很快过时。

因此,美国正在形成的是一种“能力型军民两用治理”。监管对象不是某个产品,而是模型在网络、生物化学、自主智能体、AI研发、军事和关键基础设施中的实际能力。治理工具也不再只是出口许可证,而是预发布评测、可信用户名单、分层访问、政府采购标准、供应链风险认定、持续监控和事故后召回。

事实上的模型许可制

鲍尔撰文提出了一个很重要的判断:特朗普政府原本声称建立的是自愿测试框架,但现实中已经演变为事实上的非自愿许可或预审批制度。

鲍尔并不认为政府关注AI风险是错的。相反,他承认前沿AI的灾难性风险是真实的,尤其是在网络、生物安全和未来自主能力方面。但他批评当前机制最大的问题是:没有人知道怎样才能“合规”。政府自己似乎也没有清晰标准。实验室不知道什么样的防护足以让模型公开发布,企业也不知道政府下次会不会突然叫停某个模型。

这就产生了政策不确定性。前沿模型训练成本极高,商业回报往往集中在发布后的几个月窗口期。如果每个模型都要等政府临时判断,每周延迟都会影响实验室收入、基础设施回报和AI投资逻辑。更大的风险是,限制过严会让最强模型只掌握在极少数政府批准的组织手中,反而削弱民主社会的广泛扩散和防御能力。

鲍尔的建议不是取消治理,而是把治理制度化。他建议以各大实验室的安全框架为起点,把州级要求联邦化,要求前沿实验室公开并提交安全与安保框架;同时建立独立验证组织,对实验室是否遵守自己的安全计划、是否有效治理内部AI研发自动化和递归自我改进进行审计。政府可以认证这些独立审计机构,企业获得认证后可以得到责任安全港、采购资格或市场认可。

参考:

https://openai.com/index/previewing-gpt-5-6-sol/ "Previewing GPT-5.6 Sol: a next-generation model | OpenAI"

https://www.anthropic.com/news/fable-mythos-access "Statement on the US government directive to suspend access to Fable 5 and Mythos 5 \ Anthropic"

https://www.hyperdimensional.co/p/what-should-be-done "What Should Be Done - by Dean W. Ball - Hyperdimensional"

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
据爆料:听说某大厂西安研究所一个女员工,终身合同耗了三年不走,今年被hr带着保安抬出公司了。

据爆料:听说某大厂西安研究所一个女员工,终身合同耗了三年不走,今年被hr带着保安抬出公司了。

纯洁的微笑
2026-06-25 12:49:08
安世中国将彻底独立,荷兰剩空壳?安世被抢9个月,最后如何收场

安世中国将彻底独立,荷兰剩空壳?安世被抢9个月,最后如何收场

白浅娱乐聊
2026-06-28 00:11:46
森林狼想换布朗,凯尔特人要戈贝尔+里德+签,被吓退后改换鲍尔

森林狼想换布朗,凯尔特人要戈贝尔+里德+签,被吓退后改换鲍尔

奕辰说球
2026-06-27 21:44:51
流量演员又来糟蹋央视正剧?全程演技夸张、表情用力过猛,连毛晓彤都接不住对手戏

流量演员又来糟蹋央视正剧?全程演技夸张、表情用力过猛,连毛晓彤都接不住对手戏

陈意小可爱
2026-06-27 13:12:25
英伟达遭禁“Blackwell”AI服务器在中国黑市飙至110万美元

英伟达遭禁“Blackwell”AI服务器在中国黑市飙至110万美元

cnBeta.COM
2026-06-25 21:31:04
俄媒爆出猛料,普京无视中国航发,苏57被迫难产,歼20产能已破百

俄媒爆出猛料,普京无视中国航发,苏57被迫难产,歼20产能已破百

小涛叨叨
2026-06-27 15:04:25
首战踢了62分钟就被废!安帅用一场大胜证明,这中锋真配不上巴西队

首战踢了62分钟就被废!安帅用一场大胜证明,这中锋真配不上巴西队

海阔山遥YAO
2026-06-27 15:41:16
余承东:全新一代问界M9上市1个月大定破42000台

余承东:全新一代问界M9上市1个月大定破42000台

快科技
2026-06-27 18:31:12
冠军赛吴艳妮12秒99逆转夺冠 冲过终点后与摔倒的莫家蝶拥抱

冠军赛吴艳妮12秒99逆转夺冠 冲过终点后与摔倒的莫家蝶拥抱

劲爆体坛
2026-06-27 20:31:25
比缅北更恐怖!曾经的旅游胜地,如今黄赌毒俱全,性交易随处可见

比缅北更恐怖!曾经的旅游胜地,如今黄赌毒俱全,性交易随处可见

来科点谱
2026-02-18 07:17:42
曝普京官邸被拆除!克宫10公里处增设S400防空系统

曝普京官邸被拆除!克宫10公里处增设S400防空系统

项鹏飞
2026-06-27 22:13:52
胆大包天!日本竟模拟攻击辽宁舰

胆大包天!日本竟模拟攻击辽宁舰

中国网
2026-06-27 15:39:31
转让老婆?厦门男子100万出售媳妇儿,女子很赞同,全程听丈夫话

转让老婆?厦门男子100万出售媳妇儿,女子很赞同,全程听丈夫话

兵哥观世界
2026-06-26 04:29:22
超级大乐透第26071期:中出一等奖1注(追加0注),奖池累计8.44亿元

超级大乐透第26071期:中出一等奖1注(追加0注),奖池累计8.44亿元

新浪财经
2026-06-27 22:06:56
经济下行,到处都是陷阱。

经济下行,到处都是陷阱。

老陆不老
2026-06-27 20:08:16
现场画面来了!中俄在日本海、东海、太平洋西部空域组织联合巡航

现场画面来了!中俄在日本海、东海、太平洋西部空域组织联合巡航

环球网资讯
2026-06-27 19:06:01
丰田官宣新车:9月3日,正式上市

丰田官宣新车:9月3日,正式上市

科技堡垒
2026-06-25 09:52:46
故事:72年女知青生下儿子后返城,43年后,儿子到上海寻亲当场泪崩

故事:72年女知青生下儿子后返城,43年后,儿子到上海寻亲当场泪崩

五元讲堂
2025-03-25 18:34:55
“一天一个价”!有网友晒单:去年不到7千,今年1.2万了

“一天一个价”!有网友晒单:去年不到7千,今年1.2万了

中国经济网
2026-06-26 15:53:04
高市早苗最担心的事出现:日本“放低身段”求见,中方已读不回

高市早苗最担心的事出现:日本“放低身段”求见,中方已读不回

空天力量
2026-06-27 19:09:56
2026-06-28 03:32:49
未尽研究 incentive-icons
未尽研究
新能源、人工智能、合成生物、地缘X
408文章数 65关注度
往期回顾 全部

科技要闻

GPT-5.6发布,你暂时用不了!Mythos也放行

头条要闻

金价大跌 有商家资产缩水百万:跌掉一辆迈巴赫

头条要闻

金价大跌 有商家资产缩水百万:跌掉一辆迈巴赫

体育要闻

世界杯最火门将,站到了阿根廷和梅西面前

娱乐要闻

四提白玉兰终封后,杨紫:仍觉不真实

财经要闻

OpenAI推迟IPO重创软银!

汽车要闻

搭载华为乾崑ADS 5 全新猛士M817上市售29.99万起

态度原创

手机
本地
旅游
家居
健康

手机要闻

vivo产品副总裁黄韬:对vivo X Fold6销量非常有信心

本地新闻

世界杯球迷节:比球赛更好玩的派对

旅游要闻

滇池南岸太平关,古时马帮歇脚避风港,藏着老一辈赶路的全部念想

家居要闻

绿意盎然 自然之境

“无糖汤圆”是否隐藏着健康陷阱?

无障碍浏览 进入关怀版