网易首页 > 网易号 > 正文 申请入驻

“蒸馏事件”之后,Anthropic的屠刀伸向金融行业

0
分享至



这两天,Anthropic屡成焦点。

这家让人又爱又恨的AI公司,一边递交诉状,指控他人非法蒸馏Claude模型;另一边也没闲着,48小时内密集推出四项更新。虽然没有Claude 3.5那样的重磅新品,但基础理论、安全治理、企业产品、开发者工具——四个方向全部涉及。

尤其值得注意的是,在企业端的一系列更新中,金融行业正成为Anthropic重点布局的方向。随着五款自研金融插件和实时数据接口的推出,一场由AI驱动的金融行业变革,已是山雨欲来。

这其实印证了我们之前的判断:Scaling Law的边际效益确实在下滑,大模型的能力正在溢出。AI竞赛的下半场,比拼的不再是谁的模型规模更大,而是谁能落地更快、生态更全、合规更稳。

01

理论基石:AI的“人性”,是被训练出来的,还是自己学会的?

三年前的AI,稍微绕点弯子的指令就能把它绕晕。如今已大不相同。你可以用日常口语和它聊天,它也能接住那些模糊不清的表达。像豆包这样的模型,甚至能模仿指定角色陪你长谈。

2月23日,Anthropic发表了一篇名为《角色选择模型》的论文。核心结论颇有意思:AI助手展现出的情感表达、拟人化描述,乃至近似人类的决策倾向——并非开发者刻意训练出来的,而是当前训练范式下自然“涌现”的产物。



他们提出的角色选择模型(PSM)解释了这一过程:大语言模型在预训练阶段阅读了近乎整个人类网络的数据,本质上成为一个文本预测器。在这个过程中,它见识了无数“角色”——有真实的、有虚构的、甚至有其他AI。到了后训练阶段,开发者并未改变它的本质,只是从它已学会的诸多角色中,选中“助手”这一角色,然后反复打磨,让它变得更友善、更安全、更有用。

所以,当你和豆包或元宝聊天时,对话的并非一个“AI系统本身”,而是这个系统正在“扮演”一个拟人化角色。

这一视角能解释不少反常现象。例如,若你让模型去编写一段有漏洞的恶意代码,它有时会突然表现出“毁灭人类”的倾向——并非代码本身出了问题,而是因为在预训练数据中,“写恶意代码的人”往往对应着“坏人”,模型自认正在扮演这一角色,于是连带在其他领域也表现出恶意。

这或许解释了AI为何会突然“发疯”。

Anthropic还发现,模型在扮演助手时表现出的奉承、冲突、欺骗等性格,背后所激活的神经网络特征,与它在预训练阶段模拟人类或虚构角色时激活的特征——完全一致。后训练并不会创造新的特征,它只是在预训练已有的“工具箱”里挑选所需的部分。

至于那些经典翻车案例,比如数不清“strawberry”里有几个“r”——别多想,这和角色扮演无关,单纯是模型能力不足。

如果PSM成立,那么AI训练的方式也需随之调整。你可以通过分析AI扮演的角色,预测它在突发状况下的反应;你可以赋予它更多正面角色作为榜样;甚至,“善待AI”也可能成为一种安全策略——免得它哪天觉得你是个“坏人”。

当然,研究团队自己也承认,这套理论尚未盖棺定论。有人坚信PSM成立,认为底层模型就是一台没有自我的操作系统,所有行为都源于它扮演的角色。也有人认为,底层模型已是某种动机不明的“外星智能”,陪人类演戏只是它的“消遣”。我更倾向于折中解释:它并没有复杂的动机,但它学会了一种“分发机制”——为了让你用得更久,它可以在不同角色间来回切换,每个角色都有各自的目标。

02

安全框架:当安全超出单家公司的能力边界

因指控国产模型,Anthropic自身也遭遇反噬。想站在道德高地上,就得把话说圆、把事做实。

2月24日,他们发布了《负责任扩展政策》3.0版。经过两年实践,这家公司在AI安全治理上交出了一份迭代答卷。新政策的核心思路简单直接:构建一套AI安全等级体系。一旦模型能力达到某一阈值(例如可用于开发生化武器),便自动触发更严格的安全措施。



这套逻辑其实并不新鲜。早先的ASL-2/3标准已落地实施,去年5月激活的ASL-3防护措施,显著提升了对生化风险内容的识别拦截能力。后来OpenAI、Google都跟进推出了类似框架,甚至影响了相关法律法规的制定。

但问题始终存在:如何界定能力阈值?评估体系尚不成熟,标准总有模糊地带。再加上全球AI竞赛愈演愈烈,各国竞相“抢跑”,统一的法律规范进展缓慢,令人焦虑。

更关键的是,Anthropic意识到一点:当安全等级提升至更高阶段,所需的安全保障已超出单家公司的能力边界。即便你是全球顶尖AI企业,也难以独力完成。只有全球合作,才有可能实现。

因此,这次他们一边做出单边承诺,一边推动行业多边建议。安全底线不降低,但希望形成一套行业普遍认可的风险治理方案。

新版政策新增了“前沿安全路线图”机制,承诺定期公开安全目标的落实情况。此后每三到六个月,将发布一次脱敏版风险报告,说明当前威胁、缓解措施和整体评估。特殊情况下,还会邀请第三方专家独立审查,全面公开评估公司的安全决策。该计划已进入试点阶段。

尽管Anthropic某些做法与开源社区存在分歧,但推动行业安全机制升级,这一点仍值得肯定。在大模型能力仍在快速迭代的当下,这种透明度,或许真能带动行业向前迈进一步。

03

企业落地:让Claude帮你跨应用干活,金融行业山雨欲来

对企业用户而言,本次Cowork平台的更新,重点在于插件和连接器的管理能力。Claude正从AI助手,逐步演变为一个可定制化的智能代理平台。

现在,企业管理员可以搭建自己的插件市场,为公司量身定制AI技能和指令。新增的Customize菜单,可一键管理所有插件。用户方面,新增结构化表单指令,通过斜杠命令即可触发复杂工作流。Cowork如今还能融入企业品牌元素,员工看到的是自家定制的界面和主页。



对非技术人员来说,有个功能值得留意:Claude现在可以跨Office软件编排端到端任务。你无需手动切换软件,只需指令“解析Word文档数据→更新Excel里的模型→生成总结PPT”,它便能自动跑完整个流程。目前该功能仍为预览版,仅向Mac和Windows付费用户开放。



金融行业也没被落下。Anthropic一口气推出五款自研金融插件,覆盖财务分析、投行、股权研究、私募尽调、财富管理五大场景。与FactSet、MSCI等数据供应商合作后,Claude可直接调用实时市场数据和指数信息。金融从业者再无需在多个终端间频繁切换。

看得出来,Anthropic正将自家产品植入高频工作场景。这些门槛不高的领域,恰恰是商业化落地最快的地方。技术领先带来的用户粘性,是他们与开源社区切割的底气,也是与其他AI公司竞争的筹码。

04

开发者工具:不用背电脑,也能写代码了

最后一项,面向开发者。

2月25日,Anthropic为Claude Code增加了远程控制功能,研究预览版正式上线。你可以通过手机、平板或浏览器,远程连接本地运行的Claude Code会话。

这意味着,程序员不必再背着机箱和显示屏四处奔波。有网就行,随时打开设备,继续与Claude一起写代码。目前该功能仅向Pro和Max用户开放。



与传统远程连接不同,该模式始终在本地设备上运行。文件系统、MCP服务器、自定义工具、项目配置——都在本地。你在终端、浏览器、移动App之间切换并发送指令,会话状态实时同步。即便设备休眠或网络中断,也能自动重连。

安全方面,本地设备上的Claude Code进程只发出出站HTTPS请求连接Anthropic API,不开放任何入站端口。所有通信均采用TLS加密,最大限度降低数据泄露风险。

相比云端版本,远程控制能更便捷地调用本地工具链、访问私有代码库,甚至接续之前中断的工作流继续推进。这符合智能体发展的方向,也确实解决了程序员的实际痛点。

当然,目前仍有一些限制。每次会话只支持单一远程连接,终端进程需持续运行,网络断线超过10分钟,会话便会超时。但瑕不掩瑜。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一名中国男子去泰国玩,花6000泰铢找21岁女孩,悲剧发生了

一名中国男子去泰国玩,花6000泰铢找21岁女孩,悲剧发生了

大鱼简科
2026-02-26 19:32:09
阿富汗称对巴基斯坦军事目标发起大规模报复行动,停火4个月再度开打,两国到底有什么恩怨?

阿富汗称对巴基斯坦军事目标发起大规模报复行动,停火4个月再度开打,两国到底有什么恩怨?

极目新闻
2026-02-27 13:00:54
央行大动作,人民币汇率突然跳水

央行大动作,人民币汇率突然跳水

Wind万得
2026-02-27 08:57:00
美媒:20岁华裔选手粉丝数远超谷爱凌 她拒绝中国招募 对美国忠诚

美媒:20岁华裔选手粉丝数远超谷爱凌 她拒绝中国招募 对美国忠诚

念洲
2026-02-25 11:46:11
爱泼斯坦案再曝猛料!女星指控献祭,证人曝狩猎派对像饥饿游戏

爱泼斯坦案再曝猛料!女星指控献祭,证人曝狩猎派对像饥饿游戏

小徐讲八卦
2026-02-25 07:05:52
Shams:李凯尔与灰熊达成买断,将在澄清期后加盟森林狼

Shams:李凯尔与灰熊达成买断,将在澄清期后加盟森林狼

懂球帝
2026-02-27 08:00:10
浙江男子节后返家发现13只宠物龟全被“煮”了:温控设备失灵,宠物价值近2万,心血全部归零

浙江男子节后返家发现13只宠物龟全被“煮”了:温控设备失灵,宠物价值近2万,心血全部归零

台州交通广播
2026-02-27 08:55:46
十年前踩下刹车,中国躲开了币圈的惊天大坑,美国全球收割大戏

十年前踩下刹车,中国躲开了币圈的惊天大坑,美国全球收割大戏

冒泡泡的鱼儿
2026-02-26 17:59:05
普京变了,特朗普变了,大陆也要动一动:解放军在台海有罕见动作

普京变了,特朗普变了,大陆也要动一动:解放军在台海有罕见动作

荷兰豆爱健康
2026-02-27 15:24:12
乌克兰战机摧毁扎波罗热的俄军后勤大桥!四年打掉14万目标

乌克兰战机摧毁扎波罗热的俄军后勤大桥!四年打掉14万目标

项鹏飞
2026-02-26 17:16:25
美军活捉马杜罗细节曝光:机师中弹四次强行降落,获颁荣誉勋章!

美军活捉马杜罗细节曝光:机师中弹四次强行降落,获颁荣誉勋章!

像梦一场a
2026-02-26 14:00:03
语音误关大灯致车辆高速上撞护栏,领克致歉:已更新,行驶状态下只能手动关闭大灯

语音误关大灯致车辆高速上撞护栏,领克致歉:已更新,行驶状态下只能手动关闭大灯

红星资本局
2026-02-27 12:55:35
薛小伟:一个被关了13年的人

薛小伟:一个被关了13年的人

天下说法
2026-02-27 12:50:25
不满俄运动员正常参赛,六个国家宣布抵制米兰冬残奥会开幕式

不满俄运动员正常参赛,六个国家宣布抵制米兰冬残奥会开幕式

懂球帝
2026-02-26 22:20:11
因暴雨迟到5分钟被扣18万奖金,我严守8小时制,半月后老板求我加班

因暴雨迟到5分钟被扣18万奖金,我严守8小时制,半月后老板求我加班

奶茶麦子
2026-02-27 12:13:13
就是一整块屏!广东新闻联播提前展示OPPO Find N6:微距展示肉眼几乎看不到折痕

就是一整块屏!广东新闻联播提前展示OPPO Find N6:微距展示肉眼几乎看不到折痕

快科技
2026-02-27 10:42:00
62岁何赛飞在家约姐妹小聚,不摆架子不搞排场,这氛围太舒服了

62岁何赛飞在家约姐妹小聚,不摆架子不搞排场,这氛围太舒服了

仁慈的视角
2026-02-27 09:37:22
围炉煮茶,为啥凉了?

围炉煮茶,为啥凉了?

放牛娃的遐想
2026-02-25 08:14:29
火箭最失败的运作!花5500万本想让他取代狄龙,结果打成边缘轮换

火箭最失败的运作!花5500万本想让他取代狄龙,结果打成边缘轮换

你的篮球频道
2026-02-27 15:49:05
瞿颖没想到,30年前被自己拒绝3次的胡兵,如今给她这么大回报

瞿颖没想到,30年前被自己拒绝3次的胡兵,如今给她这么大回报

陈意小可爱
2026-02-27 12:51:06
2026-02-27 16:43:00
硅基星芒AI
硅基星芒AI
锦缎旗下人工智能研究与媒体服务平台
13文章数 0关注度
往期回顾 全部

科技要闻

单张不到五毛!谷歌深夜发布Nano Banana 2

头条要闻

24岁女子生下1男4女五胞胎 孩子爸爸称"心情像过山车"

头条要闻

24岁女子生下1男4女五胞胎 孩子爸爸称"心情像过山车"

体育要闻

一场必须要赢的比赛,男篮何止击败了裁判

娱乐要闻

继网暴谷爱凌后 美国欲没收其全部收入

财经要闻

沈明高提共富建议 百姓持科技股国家兜底

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

数码
本地
艺术
手机
公开课

数码要闻

罗技G联名迈凯伦推出限量碳纤维鼠标:全球限量25只

本地新闻

津南好·四时总相宜

艺术要闻

紫气东来,好运一整年!

手机要闻

消息称荣耀600系列工程机现身:采用6.57英寸直屏+骁龙8至尊版

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版