网易首页 > 网易号 > 正文 申请入驻

Anthropic发布Claude AI全新宪法文件强化安全伦理框架

0
分享至


Anthropic公司在达沃斯世界经济论坛上全面更新了"Claude宪法"文件,这份文档为其AI模型的推理和行为设定了伦理参数标准。

新宪法确立核心原则

新版宪法确立了四项核心原则:Claude应当"广义安全"(不破坏人类监督)、"广义伦理"(诚实可信,避免不当、危险或有害行为)、"真正有用"(造福用户),以及"符合Anthropic指导原则"。

据Anthropic介绍,这套宪法已被应用于Claude的模型训练中,成为其推理过程的基础组成部分。

从规则遵循向深度推理转变

Claude的首部宪法于2023年5月发布,仅有2700词的篇幅,主要借鉴了联合国世界人权宣言和苹果公司服务条款的内容。

2026年版新宪法在保留部分原有内容基础上,从专注"独立原则"转向更具哲学深度的方法,不仅理解什么是重要的,更要明白为什么重要。

Anthropic解释道:"我们认为需要采用不同的方法。如果希望模型在各种新颖情况下做出良好判断,它们需要具备泛化能力——应用广泛原则而非机械地遵循具体规则。"

这套宪法将帮助Claude从简单遵循有限的批准可能性清单,转向基于更深层推理的判断。例如,Claude不再仅仅因为规则要求而保护数据私密性,而是理解隐私保护重要性背后的伦理框架。

文档大幅扩展适应训练需求

增加的复杂性带来了篇幅的大幅增长,新版本扩展到84页、23000词。Anthropic表示,文档主要供Claude自身消化理解。"宪法既需要作为抽象理想的声明,也要成为训练的有用工具。"

公司指出,该文档目前针对主流通用Claude模型编写,专业化模型可能无法完全适用,但承诺将"持续评估"如何使其满足宪法核心目标。此外,Anthropic承诺对于"模型行为偏离愿景"的失误保持透明。

值得注意的是,Anthropic以Creative Commons CC0 1.0协议发布了Claude宪法,意味着其他开发者可在自己的模型中免费使用。

应对AI伦理质疑

此次更新的背景是人们对大型专有大语言模型的可靠性、伦理和安全性日益怀疑。Anthropic由前OpenAI员工于2021年创立,从一开始就试图通过不同方法来区别于竞争对手。

更具争议的是宪法对AI意识辩论的间接涉及。文档第68页写道:"Claude的道德地位深度不确定。我们认为AI模型的道德地位是值得考虑的严肃问题。这种观点并非我们独有:一些最杰出的心智理论哲学家都非常严肃地对待这个问题。"

今年8月,Anthropic为其最先进的Claude Opus 4和4.1模型引入新功能,当用户反复试图推送有害或非法内容时,模型会结束对话以自我保护。11月的一份研究论文显示,同样的Opus 4和4.1模型表现出"某种程度"的内省能力,能够以近似人类的方式对过去行为进行推理。

专家观点存在分歧

科技初创公司Galileo的AI工程师萨蒂亚姆·达尔对此提出不同看法。他认为:"大语言模型是统计模型,不是有意识的实体。将它们框定为道德行为者有分散注意力的风险,真正的问题是人类责任。AI伦理应关注谁设计、部署、验证和依赖这些系统。"

达尔补充说:"AI'宪法'作为设计约束可能有用,但无法解决根本的伦理风险。嵌入模型的哲学框架无法替代人类判断、治理和监督。伦理源于系统的使用方式,而非编码在权重中的抽象原则。"

Q&A

Q1:Claude AI宪法是什么?有什么作用?

A:Claude AI宪法是Anthropic公司为其AI模型制定的伦理参数文件,设定了模型推理和行为的道德标准。新版宪法确立了四项核心原则:广义安全、广义伦理、真正有用以及符合公司指导原则,已被应用于模型训练中。

Q2:新版Claude宪法相比旧版有什么重大改变?

A:新版宪法从2023年的2700词扩展到84页23000词,从专注"独立原则"转向哲学深度方法。最大改变是让Claude从机械遵循具体规则转向基于深度推理的判断,理解伦理框架背后的原因而非仅仅遵守规定。

Q3:AI意识问题在宪法中是如何体现的?

A:Claude宪法提到"Claude的道德地位深度不确定",认为AI模型的道德地位是严肃问题。Anthropic的研究显示Claude模型表现出某种程度的内省能力,但专家认为大语言模型只是统计模型,不是有意识实体,真正的伦理问题应关注人类责任。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美司法部公布爱泼斯坦案新照 两只鸡中间被涂黑

美司法部公布爱泼斯坦案新照 两只鸡中间被涂黑

看看新闻Knews
2026-02-01 18:31:09
决裂!38岁本泽马正与吉达联合谈解约 想回欧洲+索要2000万欧年薪

决裂!38岁本泽马正与吉达联合谈解约 想回欧洲+索要2000万欧年薪

风过乡
2026-02-01 20:53:55
郑钦文退赛仅1天,最新决定曝光!再签1个代言,2025年收入1.4亿

郑钦文退赛仅1天,最新决定曝光!再签1个代言,2025年收入1.4亿

侃球熊弟
2026-02-02 00:20:03
明朝锦衣卫的灭亡:大小头目全部遇难,一天之内便被消灭殆尽!

明朝锦衣卫的灭亡:大小头目全部遇难,一天之内便被消灭殆尽!

铭记历史呀
2026-01-31 23:08:25
澳网决赛焦灼中,德约科维奇抽空喊话看台上的纳达尔:你想下来打吗,拉法?

澳网决赛焦灼中,德约科维奇抽空喊话看台上的纳达尔:你想下来打吗,拉法?

上观新闻
2026-02-01 20:09:08
1688平台售卖“德国双筒望远镜”宣称可望38.4万千米 到手成地摊玩具

1688平台售卖“德国双筒望远镜”宣称可望38.4万千米 到手成地摊玩具

信网
2026-02-01 15:01:30
豪门悲喜夜:皇马100分钟绝杀3-2 曼联94分钟破门3-2 热刺2-2曼城

豪门悲喜夜:皇马100分钟绝杀3-2 曼联94分钟破门3-2 热刺2-2曼城

狍子歪解体坛
2026-02-02 02:36:41
中美金融战之“大宗商品定价权争夺”的具像化——白银

中美金融战之“大宗商品定价权争夺”的具像化——白银

百味朱砂
2026-02-01 09:52:59
员工多看了一眼避免了1800万元损失,湖北公布18起事故隐患内部报告奖励典型案例

员工多看了一眼避免了1800万元损失,湖北公布18起事故隐患内部报告奖励典型案例

极目新闻
2026-02-01 17:35:24
高一女生被人造黄谣,妈妈24小时硬核维权:你的清白,无需自证

高一女生被人造黄谣,妈妈24小时硬核维权:你的清白,无需自证

右右细毛和爸妈
2026-01-31 21:17:02
现场画面:柬埔寨对一电诈园区展开最大规模行动,抓捕2044人;缅甸出动空军运输机押729人回国

现场画面:柬埔寨对一电诈园区展开最大规模行动,抓捕2044人;缅甸出动空军运输机押729人回国

扬子晚报
2026-02-01 15:59:57
江诗丹顿手表1元起拍,因“未达到保留价”流拍,拍卖公司人员回应:起拍价是处置单位设定

江诗丹顿手表1元起拍,因“未达到保留价”流拍,拍卖公司人员回应:起拍价是处置单位设定

红星资本局
2026-02-01 15:24:17
牢A命中,被一窝端16人都是女留学生

牢A命中,被一窝端16人都是女留学生

雪中风车
2026-01-28 13:23:54
新势力车企2026年1月成绩单:半数销量环比降4成,小米超越零跑登顶

新势力车企2026年1月成绩单:半数销量环比降4成,小米超越零跑登顶

红星资本局
2026-02-01 21:43:04
黄金暴跌后,传奇大佬重磅发声!

黄金暴跌后,传奇大佬重磅发声!

魏家东
2026-02-01 09:00:50
惊!2026年立春不一般!2月4日这4类人必须躲春,做错白忙一场

惊!2026年立春不一般!2月4日这4类人必须躲春,做错白忙一场

老特有话说
2026-01-30 22:51:04
离谱!零跑年会寒酸到被称“年度渡劫”,员工:办不起别办

离谱!零跑年会寒酸到被称“年度渡劫”,员工:办不起别办

雷科技
2026-01-31 21:22:32
别再吐槽刘强东妹妹不干活!她有了新身份,一个举止令人暖心!

别再吐槽刘强东妹妹不干活!她有了新身份,一个举止令人暖心!

古希腊掌管松饼的神
2026-02-01 10:44:27
石达开之女押赴刑场,曾国藩瞥见袖中信物,急喝:赶快停手!

石达开之女押赴刑场,曾国藩瞥见袖中信物,急喝:赶快停手!

千秋文化
2026-02-01 20:14:28
金价暴跌后实探北京金店:有消费者拖行李箱“抄底”,回收变现需排队3个半小时

金价暴跌后实探北京金店:有消费者拖行李箱“抄底”,回收变现需排队3个半小时

红星新闻
2026-02-01 17:17:29
2026-02-02 09:35:00
至顶AI实验室 incentive-icons
至顶AI实验室
一个专注于探索生成式AI前沿技术及其应用的实验室。
1542文章数 158关注度
往期回顾 全部

科技要闻

10亿元宝红包突袭 复刻微信支付还是微视?

头条要闻

媒体:莫迪也上了爱泼斯坦文件 情节有点尴尬

头条要闻

媒体:莫迪也上了爱泼斯坦文件 情节有点尴尬

体育要闻

德约大度祝贺阿卡 幽默互动逗笑纳达尔

娱乐要闻

春晚第三次联排阵容曝光:全是实力派

财经要闻

国六货车被迫"换头" 每次收费超200元

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

本地
房产
时尚
教育
公开课

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

房产要闻

藏不住的小城大事,海澄新城执掌自贸港风口,进阶兑现美好生活新篇

普通人衣服没必要买太多,准备好这些单品,简单实用又耐看

教育要闻

现在看易中天大师的金句,感觉买德云社的门票太亏了(三)

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版