当地时间2月5日,美国人工智能体初创公司Anthropic发布了其最强人工智能模型的新版本Claude Opus 4.6,主要用于执行金融研究。该公司称,该版本能够检视企业数据、监管备案文件和市场信息,并生成详细的金融分析报告,通常这类工作通常需要人工耗时数天才能完成。此外,Opus 4.6还将提升一系列其他办公功能,包括制作电子表格和演示文稿,以及软件开发。
该消息发布后,美股金融服务公司股价应声下跌,辉盛研究系统(FDS.US)跌幅一度高达10%,汤森路透(TRI)一度跌超9%,标普全球(SPGI.US)、穆迪(MCO.US)和纳斯达克(NDAQ.US)股价也均大幅走低。
据公司官网介绍,该模型的性能在多项评估中都是最先进的。例如,它在代理编码评估Terminal-Bench 2.0上取得了最高分,并在复杂的多学科推理测试Humanity's Last Exam上领先于所有其他前沿模型。在GDPval-AA(对金融、法律和其他领域具有经济价值的知识工作任务的绩效评估)中,Opus 4.6比业界次优模型(OpenAI 的 GPT-5.2)高出约144个 Elo 点,比其前身(Claude Opus 4.5)高出190点。 Opus 4.6在BrowseComp上的表现也优于任何其他模型,BrowseComp 衡量模型在线查找难以找到的信息的能力。
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.