网易首页 > 新闻中心 > 新闻 > 正文

蚂蚁 Agentar-Fin-R1:重构金融智能体开发平台技术底座,定义行业服务新标杆

0
分享至

(原标题:蚂蚁 Agentar-Fin-R1:重构金融智能体开发平台技术底座,定义行业服务新标杆)

当金融业务进入智能化深水区,对 AI 模型的专业深度、推理精度和合规可靠性提出了前所未有的要求。蚂蚁集团推出的 Agentar-Fin-R1系列金融大语言模型,以8B 和32B 参数规模为支点,通过三大核心创新构建起金融智能体开发平台Agentar的 “最强服务引擎”,重新定义了金融 AI 的技术边界与应用可能。

一、直击行业痛点:金融智能体的 “能力断层” 与解决方案

现有金融 LLM 存在显著能力短板:非推理型模型虽整合领域知识,却缺乏复杂决策所需的多步分析能力;推理增强型模型则在场景适配性上不足,难以应对市场动态、合规约束等金融特有需求。

Agentar-Fin-R1的突破在于构建了 “知识 - 推理 - 合规” 三位一体的架构:

专业标签体系:通过场景(银行、证券、保险等)与任务类型(实体识别、意图分类等)的二维标签系统,实现金融任务的精准拆解与数据对齐,确保模型理解金融业务的 “语境特殊性”。

多层级可信框架:从源头(权威金融数据)、合成(多智能体验证)到治理(去重、 detox 等),全链路保障数据可信度,解决金融领域 “幻觉输出” 的合规风险。

动态归因系统:通过实时追踪模型错误来源,定向优化数据分配与训练策略,让模型在风险评估、 portfolio 优化等复杂任务中持续进化。

二、技术突破:让金融智能体 “会思考、可信赖、高效率”

Agentar-Fin-R1的技术架构直指金融智能体开发的核心诉求 ——高性能与高可靠的平衡。

难度感知的加权训练框架

传统训练对简单与复杂任务 “一视同仁”,导致模型在高价值复杂任务(如多步风险定价)上表现薄弱。该模型通过 pass@k 分数动态评估任务难度,对低通过率任务赋予更高训练权重,例如在信贷违约预测等高频复杂场景中,模型关注度提升30% 以上,显著降低决策误差。

两阶段训练的效率革命

第一阶段:通过监督微调(SFT)注入金融知识,整合300K + 高质量金融推理数据,构建基础能力底座;

第二阶段:采用 GRPO 强化学习与靶向微调结合,专攻复杂场景(如动态合规校验),使模型在 Finova 基准的复杂推理维度得分达56.33,超越 GPT-o1等通用大模型15% 以上。

Finova 基准:定义金融智能体的 “实战标准”

蚂蚁创新推出的 Finova 基准,从智能体能力(意图识别、工具规划等)、复杂推理(金融数学、代码理解)、安全合规三大维度,全面模拟真实金融业务场景。Agentar-Fin-R1-32B 在该基准中以69.93的总分登顶,尤其在 “金融表达式生成”(69分)和 “安全合规”(87分)上表现碾压,证明其能直接支撑高风险业务的落地。

三、服务赋能:为金融智能体开发平台注入 “最强动力”

对于金融智能体开发平台Agentar而言,Agentar-Fin-R1的价值体现在三个层面:

开箱即用的专业能力:模型在 Fineva(92.38)、FinEval 1.0 (87.70)等权威金融基准中均居榜首,开发者无需从零训练,可直接集成到智能投顾、风控审核等系统,缩短开发周期60% 以上。

灵活适配的技术接口:支持8B(轻量化)与32B(全能力)双版本,满足从移动端客服智能体到企业级量化交易系统的差异化需求,且保持通用推理能力(MATH-500得分93.8),避免 “专精废全”。

合规兜底的安全保障:通过多智能体数据验证与动态合规校验,模型在反洗钱、信息披露等敏感场景的错误率低于0.5%,为平台提供 “合规即服务” 的底层支撑。

结语:从 “模型能力” 到 “产业价值” 的跨越

Agentar-Fin-R1的推出,不仅是技术层面的突破,更标志着金融 AI 从 “通用赋能” 向 “深度渗透” 的转型。其通过标签化数据治理、动态训练优化和场景化评估体系,为金融智能体开发平台提供了 “最强服务” 的技术范式 —— 让 AI 不仅能处理金融任务,更能理解金融业务的本质逻辑与风险边界。这一创新,或将推动智能投顾、自动化合规、跨境金融等领域的效率革命,成为蚂蚁集团在金融科技赛道的核心竞争力支点。

相关推荐
热点推荐
范志毅:U23国足半死不活的踢法世界最先进最科学 对手不会踢了

范志毅:U23国足半死不活的踢法世界最先进最科学 对手不会踢了

念洲
2026-01-18 09:41:26
加拿大考虑向格陵兰岛派兵

加拿大考虑向格陵兰岛派兵

环球网资讯
2026-01-19 06:47:29
又一网红餐厅倒闭,高端餐饮竟然被路边摊干“黄”了,到底为啥?

又一网红餐厅倒闭,高端餐饮竟然被路边摊干“黄”了,到底为啥?

青眼财经
2026-01-18 13:49:08
西安一男子找工作时被女HR频繁骚扰:“一直打电话叫宝宝,不加微信就诅咒”,平台回应:会对其审核

西安一男子找工作时被女HR频繁骚扰:“一直打电话叫宝宝,不加微信就诅咒”,平台回应:会对其审核

极目新闻
2026-01-18 21:02:37
李亚鹏房东助理回应嫣然医院“翻倍涨租金” :“我们就像东郭先生”

李亚鹏房东助理回应嫣然医院“翻倍涨租金” :“我们就像东郭先生”

极目新闻
2026-01-17 08:47:37
68死伤5失联!包钢爆炸原因被扒,内部画面流出,一画面信息量大

68死伤5失联!包钢爆炸原因被扒,内部画面流出,一画面信息量大

博士观察
2026-01-18 21:30:44
李佳琦自曝体重飙升35斤,直言:现在比以前帅多了!

李佳琦自曝体重飙升35斤,直言:现在比以前帅多了!

动物奇奇怪怪
2026-01-19 01:44:59
湖北一村弥漫刺鼻农药味,个别菜商竟偷用含毒农药!当地村民称根本不会吃这里的蔬菜

湖北一村弥漫刺鼻农药味,个别菜商竟偷用含毒农药!当地村民称根本不会吃这里的蔬菜

都市快报橙柿互动
2026-01-19 00:11:42
章泽天这次翻车,真的不冤

章泽天这次翻车,真的不冤

独立鱼
2026-01-17 22:41:59
对等关税以来,中国对美出口下降了27%,贸易盈余减少了30%

对等关税以来,中国对美出口下降了27%,贸易盈余减少了30%

子业一说财经
2026-01-18 16:15:57
破防了!27岁“天坑”硕士找不到工作,回高中复读,学生成了同学

破防了!27岁“天坑”硕士找不到工作,回高中复读,学生成了同学

火山诗话
2026-01-19 06:17:04
保质期2年的羊腿不算预制菜:西贝贾国龙依然不认为自己错了

保质期2年的羊腿不算预制菜:西贝贾国龙依然不认为自己错了

区块科技
2026-01-18 21:57:17
一生坦荡!聂卫平出书讲自己的感情经历,初恋竟让其抛弃原配娶她

一生坦荡!聂卫平出书讲自己的感情经历,初恋竟让其抛弃原配娶她

仙味少女心
2026-01-18 09:25:14
央视播报聂卫平遗体送别仪式 大儿子孔令文携弟妹扶遗像到场

央视播报聂卫平遗体送别仪式 大儿子孔令文携弟妹扶遗像到场

劲爆体坛
2026-01-18 13:18:09
68死伤5失联!包钢爆炸内部画面流出,原因曝光,大量隐情披露

68死伤5失联!包钢爆炸内部画面流出,原因曝光,大量隐情披露

博士观察
2026-01-18 20:59:39
49岁翁帆官宣喜讯,太令人惊喜了!

49岁翁帆官宣喜讯,太令人惊喜了!

神奇故事
2026-01-18 21:57:09
一天两枚火箭发射失利,中国航天科技集团、星河动力两家公司发文:具体原因正排查

一天两枚火箭发射失利,中国航天科技集团、星河动力两家公司发文:具体原因正排查

每日经济新闻
2026-01-18 13:13:23
库佐夫列夫上将还活着,库皮扬斯克交换比27:1!传奇的乌军老奶奶

库佐夫列夫上将还活着,库皮扬斯克交换比27:1!传奇的乌军老奶奶

鹰眼Defence
2026-01-18 16:50:14
“贾玲好瘦啊”登上热搜,网友:还以为是张小斐

“贾玲好瘦啊”登上热搜,网友:还以为是张小斐

红星新闻
2026-01-18 11:47:30
两人消费1400被上海服务员嘲讽!网友:在上海1400只能吃个路边摊

两人消费1400被上海服务员嘲讽!网友:在上海1400只能吃个路边摊

火山诗话
2026-01-18 11:19:13
2026-01-19 08:12:49

头条要闻

央视揭菜商使用含毒农药 村民:自己根本不吃这些蔬菜

头条要闻

央视揭菜商使用含毒农药 村民:自己根本不吃这些蔬菜

体育要闻

21年后,中国男足重返亚洲四强

娱乐要闻

香港武打演员梁小龙去世:享年77

财经要闻

BBA,势败如山倒

科技要闻

编程从此不再有门槛!Claude Code火爆出圈

汽车要闻

又一次闷声干大事,奇瑞进入2.0 AI+时代

态度原创

时尚
旅游
艺术
本地
军事航空

美拉德过时了?今年冬天最火的4个颜色竟然是它们

旅游要闻

山东今年首条入境旅游包机航线开航

艺术要闻

14位欧美画家的15幅女性作品

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

军事要闻

特朗普突然转变态度"谢谢"伊朗 淡化对伊朗的军事威胁

无障碍浏览 进入关怀版
×