网易首页 > 网易号 > 正文 申请入驻

微软Copilot让Claude与GPT携手协作,共同提升智能体研究能力

0
分享至


微软在AI领域的策略,长期以来主要依赖第三方大语言模型。起初主要使用OpenAI的GPT系列模型,近来也引入了Anthropic的Claude——而现在,微软正将两者同时整合,用于提升Copilot的研究者(Researcher)智能体的能力。

研究者智能体专为需要深度推理或跨多源信息解决问题的场景而设计,近期新增了一项可选的"批评"(Critique)功能。在这一工作流程中,GPT负责起草内容,随后由Claude进行审核。根据微软的官方声明,审核内容涵盖"准确性、完整性与引用规范性"三个维度。

微软表示,未来还可能为用户提供反向切换选项,即由Claude负责撰写、GPT负责审核。

这种工作流程乍看之下可能略显粗糙,但其实与开发者有时采用一个模型编写代码、再用另一个不同系列的模型进行代码审查的做法并无本质区别。

至少从微软的基准测试结果来看,这一方案展现出明显优势。在Perplexity的深度研究DRACO基准测试中,Anthropic的Claude Opus 4.6单独运行得分为42.7分,在Perplexity深度研究模式下得分为50.4分,而开启"批评"功能的Copilot研究者智能体得分高达57.4分,超越了所有单独模型的表现。

目前尚无OpenAI GPT-5.4的基准测试数据,但其得分预计与Opus 4.6处于相近水平。

研究功能的另一项新特性是"委员会"(Council)功能,允许用户并排对比不同模型处理同一查询的结果。

此外,微软近期还宣布将Anthropic的Claude Cowork工具引入Copilot。Cowork本质上是面向知识工作者的Claude Code,能够运行需要完成多步骤工作流的长时间智能体任务。该功能以"Copilot Cowork"为名,现已在早期访问计划Microsoft 365 Frontier中上线。

微软在此处的优势在于:许多客户对直接向Anthropic上传企业数据心存顾虑。而这些企业本已在使用Microsoft 365,Copilot Cowork的数据完全由企业自主掌控(Cowork在沙盒云环境中运行),这使他们得以放心使用这些新工具。

Capital Group企业技术高级副总裁巴顿·华纳(Barton Warner)表示:"这不是关于生成内容或答案,而是真正付诸行动——串联步骤、协调任务、贯穿日常工作流程。由于Cowork在我们的企业数据环境及安全与风险边界内运行,我们可以充满信心地进行试验、学习并推广扩展,这让我们能够更快推进,并将AI聚焦于真正能创造价值的场景。"

引入Anthropic来推出Cowork和Critique等功能,折射出微软当前所处的战略位置:一方面在逐步摆脱对OpenAI的早期依赖,另一方面也在与另一家模型供应商建立更深层的合作关系。

对于为Copilot支付高额费用的客户而言,一个核心问题始终萦绕心头:使用微软服务的价值,究竟在于其所调度的模型本身,还是在于使这些模型真正发挥作用的企业数据与信任层?

微软显然押注于后者。而对Anthropic来说,这次合作是其迈向企业AI首选供应商目标的又一重要布局。

微软商业应用与智能体总裁查尔斯·拉曼纳(Charles Lamanna)在首次宣布Cowork时曾指出:"正是这种多模型优势,让Copilot与众不同。"如果微软拥有自己的前沿模型,或许会采取不同的策略,但就现状而言,这已是其所能做出的最优选择。

Q&A

Q1:Copilot研究者智能体的"批评"功能是如何运作的?

A:Copilot研究者智能体的"批评"功能采用双模型协作机制:由OpenAI的GPT负责起草内容,再交由Anthropic的Claude进行审核,审核范围涵盖准确性、完整性与引用规范性三个方面。在Perplexity的DRACO基准测试中,开启该功能后得分达57.4分,高于Claude Opus 4.6单独运行的42.7分和深度研究模式下的50.4分,显示出明显的性能提升效果。

Q2:Copilot Cowork是什么?有什么特别之处?

A:Copilot Cowork是微软将Anthropic的Claude Cowork工具引入Copilot后推出的功能,主要面向需要处理多步骤复杂工作流的知识工作者。其核心优势在于数据安全性:Cowork运行于沙盒云环境中,企业数据无需上传至Anthropic,完全在企业自有的Microsoft 365环境内受控运行,因此特别适合对数据安全要求较高的企业客户。目前该功能已在Microsoft 365 Frontier早期访问计划中上线。

Q3:微软为什么要同时使用GPT和Claude,而不是只用一个模型?

A:微软目前没有自研的前沿大语言模型,因此必须依赖第三方模型。引入多模型策略一方面是为了减少对单一供应商OpenAI的依赖,另一方面也通过多模型协作实现性能互补——不同模型家族在审查彼此输出时往往能发现对方遗漏的问题。微软认为自身的核心价值在于整合模型的企业数据管理能力与信任层,而非模型本身,因此多模型策略是其现阶段最优解。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
终于,豆瓣还是朝着《给阿嬷的情书》打拳了,这拳打得对不对呢?

终于,豆瓣还是朝着《给阿嬷的情书》打拳了,这拳打得对不对呢?

蓬辉堂
2026-06-01 23:40:20
铜价:大家做好心理准备!从今天6月2日开始,或有更大调整行情

铜价:大家做好心理准备!从今天6月2日开始,或有更大调整行情

花小猫的美食日常
2026-06-02 18:20:46
他曾担任中央办公厅代主任,大肆迫害年迈的彭老总,后被判刑18年

他曾担任中央办公厅代主任,大肆迫害年迈的彭老总,后被判刑18年

大运河时空
2026-06-01 20:45:03
汪峰带五娃过六一!森林北女儿紧挨妈妈,二女儿汪璟怡不舍得分开

汪峰带五娃过六一!森林北女儿紧挨妈妈,二女儿汪璟怡不舍得分开

无处不风景love
2026-06-02 14:01:50
炸裂!捐精有多乱,双方直接在宾馆完成怀孕过程,一次八百到几万

炸裂!捐精有多乱,双方直接在宾馆完成怀孕过程,一次八百到几万

就一点
2026-06-02 15:45:51
女生为秀恩爱,偷偷在男友博士论文里编造了第 52 条参考文献,网友:博士男友秒变硕士前男友

女生为秀恩爱,偷偷在男友博士论文里编造了第 52 条参考文献,网友:博士男友秒变硕士前男友

生物学霸
2026-06-02 17:13:59
山西省长治市沁源县委书记赵永进被查

山西省长治市沁源县委书记赵永进被查

新京报
2026-06-02 21:29:38
CBA总决赛还没结束!上海已提前开卖冠军衫:广厦被直接无视了?

CBA总决赛还没结束!上海已提前开卖冠军衫:广厦被直接无视了?

篮球快餐车
2026-06-02 18:14:36
汪峰森林北带5娃聚餐,小苹果颜值出众,醒醒姐弟乖巧与保姆亲近

汪峰森林北带5娃聚餐,小苹果颜值出众,醒醒姐弟乖巧与保姆亲近

一娱三分地
2026-06-02 17:18:38
4年8000万!这是马刺能给尚帕尼的全部,他成进总决赛奖励第一人

4年8000万!这是马刺能给尚帕尼的全部,他成进总决赛奖励第一人

奕辰说球
2026-06-02 09:23:23
忙活一桌子,狗都不吃!丈夫过生日,妻子自我感动 ,网友吐槽

忙活一桌子,狗都不吃!丈夫过生日,妻子自我感动 ,网友吐槽

蝴蝶花雨话教育
2026-05-31 00:05:20
台积电日本3nm量产线核心负责人辞职归国!

台积电日本3nm量产线核心负责人辞职归国!

新浪财经
2026-06-02 00:05:18
以色列占领900年古堡黎巴嫩战局基本已定

以色列占领900年古堡黎巴嫩战局基本已定

海子侃生活
2026-06-01 10:10:18
河南民权发生一起交通事故致2人死亡

河南民权发生一起交通事故致2人死亡

新京报
2026-06-02 13:18:38
奉陪到底!中方强势取消3500亿美芯订单,马斯克:这只是个开始

奉陪到底!中方强势取消3500亿美芯订单,马斯克:这只是个开始

荒野科技
2026-06-02 12:44:54
霍英东临终前吐露真相:抗美援朝最致命的物资并非来自国家调拨

霍英东临终前吐露真相:抗美援朝最致命的物资并非来自国家调拨

鉴史录
2026-06-02 18:04:50
刚提 6 小时焕新 Model Y 被大货车撞全损,特斯拉车主:人没事、再买一辆!

刚提 6 小时焕新 Model Y 被大货车撞全损,特斯拉车主:人没事、再买一辆!

新浪财经
2026-06-01 15:29:48
体检报告出现这几个字,距离癌症只有一步之遥!别等得癌了才后悔

体检报告出现这几个字,距离癌症只有一步之遥!别等得癌了才后悔

健康之光
2026-06-01 08:56:18
特朗普,开掉“不听话的情报头子”

特朗普,开掉“不听话的情报头子”

中国新闻周刊
2026-06-02 21:26:00
看球赛的美女,身材真好

看球赛的美女,身材真好

蓝色海洋009
2026-05-25 20:36:25
2026-06-02 23:15:00
至顶科技 incentive-icons
至顶科技
科技产业媒体与 AI 产业服务机构
18986文章数 49708关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

小学教师疑因打井纠纷杀害邻居 死者留下两未成年儿子

头条要闻

小学教师疑因打井纠纷杀害邻居 死者留下两未成年儿子

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

智元和宇树的“暗战”愈演愈烈

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

艺术
数码
家居
健康
教育

艺术要闻

周杰伦花 1.36 亿拍下这幅画

数码要闻

华为nova 16系列发布:2999元起 全系配备后置红枫原色镜头

家居要闻

流线型轮廓 包容多元身形

违规干细胞应用,暗藏致命隐患!

教育要闻

逐梦盛夏 全城护航 | 冲刺高考政治:把握命题新导向 精准发力稳拿分

无障碍浏览 进入关怀版