网易首页 > 网易号 > 正文 申请入驻

微软Copilot让Claude与GPT携手协作,共同提升智能体研究能力

0
分享至


微软在AI领域的策略,长期以来主要依赖第三方大语言模型。起初主要使用OpenAI的GPT系列模型,近来也引入了Anthropic的Claude——而现在,微软正将两者同时整合,用于提升Copilot的研究者(Researcher)智能体的能力。

研究者智能体专为需要深度推理或跨多源信息解决问题的场景而设计,近期新增了一项可选的"批评"(Critique)功能。在这一工作流程中,GPT负责起草内容,随后由Claude进行审核。根据微软的官方声明,审核内容涵盖"准确性、完整性与引用规范性"三个维度。

微软表示,未来还可能为用户提供反向切换选项,即由Claude负责撰写、GPT负责审核。

这种工作流程乍看之下可能略显粗糙,但其实与开发者有时采用一个模型编写代码、再用另一个不同系列的模型进行代码审查的做法并无本质区别。

至少从微软的基准测试结果来看,这一方案展现出明显优势。在Perplexity的深度研究DRACO基准测试中,Anthropic的Claude Opus 4.6单独运行得分为42.7分,在Perplexity深度研究模式下得分为50.4分,而开启"批评"功能的Copilot研究者智能体得分高达57.4分,超越了所有单独模型的表现。

目前尚无OpenAI GPT-5.4的基准测试数据,但其得分预计与Opus 4.6处于相近水平。

研究功能的另一项新特性是"委员会"(Council)功能,允许用户并排对比不同模型处理同一查询的结果。

此外,微软近期还宣布将Anthropic的Claude Cowork工具引入Copilot。Cowork本质上是面向知识工作者的Claude Code,能够运行需要完成多步骤工作流的长时间智能体任务。该功能以"Copilot Cowork"为名,现已在早期访问计划Microsoft 365 Frontier中上线。

微软在此处的优势在于:许多客户对直接向Anthropic上传企业数据心存顾虑。而这些企业本已在使用Microsoft 365,Copilot Cowork的数据完全由企业自主掌控(Cowork在沙盒云环境中运行),这使他们得以放心使用这些新工具。

Capital Group企业技术高级副总裁巴顿·华纳(Barton Warner)表示:"这不是关于生成内容或答案,而是真正付诸行动——串联步骤、协调任务、贯穿日常工作流程。由于Cowork在我们的企业数据环境及安全与风险边界内运行,我们可以充满信心地进行试验、学习并推广扩展,这让我们能够更快推进,并将AI聚焦于真正能创造价值的场景。"

引入Anthropic来推出Cowork和Critique等功能,折射出微软当前所处的战略位置:一方面在逐步摆脱对OpenAI的早期依赖,另一方面也在与另一家模型供应商建立更深层的合作关系。

对于为Copilot支付高额费用的客户而言,一个核心问题始终萦绕心头:使用微软服务的价值,究竟在于其所调度的模型本身,还是在于使这些模型真正发挥作用的企业数据与信任层?

微软显然押注于后者。而对Anthropic来说,这次合作是其迈向企业AI首选供应商目标的又一重要布局。

微软商业应用与智能体总裁查尔斯·拉曼纳(Charles Lamanna)在首次宣布Cowork时曾指出:"正是这种多模型优势,让Copilot与众不同。"如果微软拥有自己的前沿模型,或许会采取不同的策略,但就现状而言,这已是其所能做出的最优选择。

Q&A

Q1:Copilot研究者智能体的"批评"功能是如何运作的?

A:Copilot研究者智能体的"批评"功能采用双模型协作机制:由OpenAI的GPT负责起草内容,再交由Anthropic的Claude进行审核,审核范围涵盖准确性、完整性与引用规范性三个方面。在Perplexity的DRACO基准测试中,开启该功能后得分达57.4分,高于Claude Opus 4.6单独运行的42.7分和深度研究模式下的50.4分,显示出明显的性能提升效果。

Q2:Copilot Cowork是什么?有什么特别之处?

A:Copilot Cowork是微软将Anthropic的Claude Cowork工具引入Copilot后推出的功能,主要面向需要处理多步骤复杂工作流的知识工作者。其核心优势在于数据安全性:Cowork运行于沙盒云环境中,企业数据无需上传至Anthropic,完全在企业自有的Microsoft 365环境内受控运行,因此特别适合对数据安全要求较高的企业客户。目前该功能已在Microsoft 365 Frontier早期访问计划中上线。

Q3:微软为什么要同时使用GPT和Claude,而不是只用一个模型?

A:微软目前没有自研的前沿大语言模型,因此必须依赖第三方模型。引入多模型策略一方面是为了减少对单一供应商OpenAI的依赖,另一方面也通过多模型协作实现性能互补——不同模型家族在审查彼此输出时往往能发现对方遗漏的问题。微软认为自身的核心价值在于整合模型的企业数据管理能力与信任层,而非模型本身,因此多模型策略是其现阶段最优解。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美财政部颁布许可,允许临时销售已装船的俄罗斯原油

美财政部颁布许可,允许临时销售已装船的俄罗斯原油

界面新闻
2026-04-18 09:03:02
台北买房无望,马筱梅吐槽北京房子旧,楼上装修太吵,人设崩塌了

台北买房无望,马筱梅吐槽北京房子旧,楼上装修太吵,人设崩塌了

八斗小先生
2026-04-17 11:14:22
结束了!勇士被淘汰!格林两场狂砍71分

结束了!勇士被淘汰!格林两场狂砍71分

篮球教学论坛
2026-04-18 13:15:56
鸿山寺61岁方丈法云身亡!事前毫无征兆,死因曝光,弟子再曝猛料

鸿山寺61岁方丈法云身亡!事前毫无征兆,死因曝光,弟子再曝猛料

青橘罐头
2026-04-17 07:19:47
高铁“变味”了?现在的高铁,为什么越来越多的人不想坐了呢?

高铁“变味”了?现在的高铁,为什么越来越多的人不想坐了呢?

许三岁
2026-04-17 20:44:18
台当局:金门淡水是老天爷给的!这就是统一不能指望台岛主动之故

台当局:金门淡水是老天爷给的!这就是统一不能指望台岛主动之故

阿龙聊军事
2026-04-17 19:30:12
游戏结束,中国运回2313吨金条,石油人民币要来了,特朗普拦不住

游戏结束,中国运回2313吨金条,石油人民币要来了,特朗普拦不住

南宗历史
2026-04-17 16:05:20
增重7公斤、油门限了15%!张雪机车仍在荷兰站练习赛上跑了第三名

增重7公斤、油门限了15%!张雪机车仍在荷兰站练习赛上跑了第三名

不似少年游
2026-04-18 11:46:55
实话实说!3支球队夺冠概率最高:不是北京队,不是广东队

实话实说!3支球队夺冠概率最高:不是北京队,不是广东队

体育哲人
2026-04-18 12:20:17
创纪录,日本军舰台海逗留14小时!不只是挑衅,真正危险信号来了

创纪录,日本军舰台海逗留14小时!不只是挑衅,真正危险信号来了

阿器谈史
2026-04-18 09:43:11
男子河边散步被铠甲怪鼠缠上,蹭着鞋子转圈,网友:腿得截肢!

男子河边散步被铠甲怪鼠缠上,蹭着鞋子转圈,网友:腿得截肢!

狸猫之一的动物圈
2026-04-13 11:10:53
女子十六为啥叫“破瓜之年”?“破瓜”是什么意思?

女子十六为啥叫“破瓜之年”?“破瓜”是什么意思?

长风文史
2026-04-17 16:53:42
马英九摊牌:两岸开战在所难免,台成不了乌克兰,只因有致命死穴

马英九摊牌:两岸开战在所难免,台成不了乌克兰,只因有致命死穴

混沌录
2026-04-16 17:31:13
4月16日俄乌最新:乌克兰终于迎来了春天

4月16日俄乌最新:乌克兰终于迎来了春天

西楼饮月
2026-04-16 19:10:03
奥黛丽赫本人生最后30年:在瑞士小镇一座带花园的漂亮房子里度过

奥黛丽赫本人生最后30年:在瑞士小镇一座带花园的漂亮房子里度过

毒舌小红帽
2026-04-17 18:24:06
詹姆斯:迪伦-哈珀非常出色,但他父亲罗恩-哈珀啥也不是

詹姆斯:迪伦-哈珀非常出色,但他父亲罗恩-哈珀啥也不是

懂球帝
2026-04-18 09:19:08
教育巨变已挡不住?2026届初中生,难道是仅靠中高考的最后一批?

教育巨变已挡不住?2026届初中生,难道是仅靠中高考的最后一批?

老特有话说
2026-04-18 01:00:03
“中俄文学中心”成立,搭建中俄科研、学术、文学与人才培养平台

“中俄文学中心”成立,搭建中俄科研、学术、文学与人才培养平台

新京报
2026-04-15 17:11:48
14岁被送上导演的床,17岁拍全裸写真,被操控半生,如今怎样了?

14岁被送上导演的床,17岁拍全裸写真,被操控半生,如今怎样了?

东方不败然多多
2026-04-17 13:38:06
黎姿普吉岛过复活节,大方穿泳装秀身材,54岁的少女感藏不住

黎姿普吉岛过复活节,大方穿泳装秀身材,54岁的少女感藏不住

吃青菜长高
2026-04-18 06:59:11
2026-04-18 13:56:49
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
17750文章数 49699关注度
往期回顾 全部

科技要闻

传Meta下月拟裁8000 大举清退人力为AI腾位

头条要闻

郑丽文称访陆后"心都定了" 陈吉宁帮她想"台湾怎么办"

头条要闻

郑丽文称访陆后"心都定了" 陈吉宁帮她想"台湾怎么办"

体育要闻

时隔25年重返英超!没有人再嘲笑他了

娱乐要闻

《穿普拉达的女王2》疑似辱华?

财经要闻

"影子万科"2.0:管理层如何吸血万物云?

汽车要闻

奇瑞威麟R08 PRO正式上市 售价14.48万元起

态度原创

教育
手机
亲子
房产
时尚

教育要闻

“有儿子的家,女儿注定是外人”,姑姑关心侄女,反被哥嫂围殴

手机要闻

三星One UI 9固件前瞻:引入碰一碰分享、增强Bixby小组件

亲子要闻

语出惊人的孩子

房产要闻

官宣签约最强城更!海口楼市,突然杀入神秘房企!

有些衣服,是穿给自己看的

无障碍浏览 进入关怀版