网易首页 > 网易号 > 正文 申请入驻

都“百模大战”了,蚂蚁数科为何要发布金融推理大模型?

0
分享至


金融行业又迎来了一个新的大模型。

7月底举行的2025世界人工智能大会(WAIC)论坛上,蚂蚁数科正式发布金融推理大模型Agentar-Fin-R1,提供32B和8B两个版本,为金融AI应用打造可靠可优化智能中枢。

该模型基于Qwen3研发,在FinEval1.0、FinanceIQ等权威金融大模型评测基准上超越同尺寸开源通用大模型以及金融大模型,显示其更强的金融专业性、推理能力以及安全合规能力。

实际上,随着大模型从技术走向应用落地,金融行业的实际业务场景中,往往需要高度专业的金融知识、复杂的业务逻辑推理能力以及严格的金融级安全合规等要求,然而,现有的基础大模型“幻觉率”依然很高,在解决实际金融任务时仍然存在诸多挑战,因此,“百模大战”下,金融这一专业领域也需要更懂金融的专业大模型。

蚂蚁数科CEO赵闻飙表示,通用大模型距离产业实际应用存在“知识鸿沟”。构建专业的金融大模型是推进金融与AI深度融合的必然路径,未来,金融大模型的应用深度将成为金融机构竞争力的关键要素。

基础大模型无法适应金融专业场景

研究机构IDC于近日发布的一份报告显示,2024年,中国金融行业生成式 AI平台及应用解决方案市场总规模约为9.14亿元人民币,约占整体AI平台及应用市场规模的14%。

由于金融行业的特殊性,往往对于数据安全性、隐私保护以及监管合规等要求高于其他行业。大多数金融机构会选择本地化部署方式落地生成式AI平台及生成式AI应用。数据显示,2024年,中国金融行业生成式 AI 平台及应用解决方案市场规模中本地化部署方式的规模约占总规模的91%。

而且,保险、消金/互金、券商等金融机构在合同审核、智能客服、知识助手等场景仍会以MaaS(MaaS)模式接入大模型,以此提供以云服务模式交付的全流程大模型生命周期工具链以及大模型服务。

WAIC一场论坛上,浙江大学教授、区块链与数据安全全国重点实验室主任陈纯表示,大模型的专业化应用,首要的是可靠性问题。尽管当前技术SOTA(指行业顶尖水平)已经达到了80%到90%的水平,但其可靠性距离医疗、工业、金融等专业场景的要求仍有显著差距。

蚂蚁数科CTO王维也表示,金融行业用好AI技术还是面临很多的挑战,包括大模型在金融场景中的“幻觉”、差错或者回答没有达到金融企业要求,“如何把通用能力和场景鸿沟弥合。从水平通用大模型向专业/专用模型演进,这也是数科持续攻坚的方向。”

事实上,蚂蚁数科此次发布的金融推理大模型Agentar-Fin-R1,就是专门面向金融任务设计,通过构建全面的金融任务数据体系以及模型训练算法创新,实现模型更强的金融推理能力及可信性。

在数据层面,蚂蚁数科构建了业内最全面与专业的金融任务分类体系,包括6大类、66小类场景,覆盖银行、证券、保险、基金、信托等金融全场景,基于千亿级金融专业数据语料,通过可信数据合成技术以及结合专家标注的金融长思维链(CoT)构造机制,显著提升模型处理复杂任务的能力;

训练层面,蚂蚁创新的加权训练算法,最大化提升数据利用效率及训练效率,同时通过动态分配训练资源,提高大模型对复杂金融任务学习效率与性能,在后续业务应用中,可以显著减少二次微调的数据需求与算力消耗,降低大模型落地企业的门槛和成本。

此外,Agentar-Fin-R1不断更新迭代,吸收最新的金融政策、市场动态等关键信息,并通过配套评测工具进行针对性优化,确保知识、能力和合规性始终紧跟行业变化,让模型能力在真实业务场景中不断进化。

评测结果显示,在业内主流的大模型金融评估基准FinEval 1.0、FinancelQ等评测中,Agentar-Fin-R1均取得最高评分,超过DeepSeek、Qwen等开源通用模型以及xuanyuan等金融大模型,并且Agentar-Fin-R1在金融能力显著增强的同时,通用能力也表现出较高水准。


为了考察大模型在实际金融场景中部署的能力,蚂蚁数科还联合中国工商银行、宁波银行、北京前沿金融监管科技研究院、上海人工智能行业协会等机构联合推出Finova大模型金融应用评测基准,深度考察智能体能力、复杂推理以及安全合规能力。

在Finova评测中,Agentar-Fin-R1也取得最高评分,甚至超越DeepSeek-R1、GPT-o1等更大参数规模的通用模型。目前Finova已经全面开源,推动行业共同提升大模型在金融领域的应用水平。

据悉,Agentar-Fin-R1包括32B和8B参数两个版本。蚂蚁数科还推出基于百灵大模型的MoE(混合专家)架构模型,获得更优推理速度。此外,还有非推理版本的14B和72B参数大模型,以满足金融机构在多样化场景下的部署需求。

“一个推理能力很强的垂直大模型,才能成为智能体可控、可靠、可优化的智能中枢。齿轮决定了机器、履带要严丝合缝,没有关键性的齿轮,那其他的齿轮就带不动。而推理模型产生出来的推理能力、泛化和意图识别能力,可以让企业更加有意愿升级原有的业务模式,否则就很难谈增量价值的创造了。”王维称。

“AI+金融”进入深水区,2027年国内规模将超35亿元

IDC预计,到2027年,中国金融行业生成式 AI 平台及应用解决方案市场规模将攀升至35.09亿元,较2024年实现384%的增幅。

IDC中国金融行业研究总监高飞表示,随着大模型相关技术的快速迭代,生成式AI在金融行业的实践正在经历从“局部工具”向“企业级平台能力”的升级。其应用场景也在由单一的效率提升,逐步拓展至业务决策的支持与任务执行。

“一个不能理解行业的大模型,它难以产生真正的价值。”王维表示,蚂蚁数科希望帮助金融行业客户解决大模型在核心业务场景落地的问题,让大模型真正深入实际应用场景,创造真实价值。

在王维看来,蚂蚁数科的优势,一方面在于背靠蚂蚁集团的底层技术能力,另一方面来自于长期深耕金融场景所积累的金融know-how能力。

今年以来,蚂蚁数科加速布局企业级大模型服务,并聚焦金融与新能源两大行业场景。

其中,在金融领域,蚂蚁数科此前推出金融智能体平台Agentar,贯通智算调度、数据与模型平台、行业大模型及应用落地全流程,助力金融机构高效搭建专业智能体应用,加速大模型在金融行业的落地应用。

今年7月,蚂蚁数科还宣布联合金融业伙伴进行创新,推出超过100个金融场景智能体解决方案,覆盖银行、证券、保险、通用等四大领域。包括零售业务助手、AI原生手机银行、智能营销和风控等多个已经在金融实际场景中深度应用的智能体解决方案。

以上海某银行为例。蚂蚁数科助力该行打造的AI手机银行,创新“对话即服务”模式,用户通过自然对话即可获取各类金融服务,月活用户同比增长25%。

蚂蚁数科与大地保险打造的“AI大模型中台”,则是保险业内首次将大模型、数据、算力和框架相结合,通过大模型技术与行业特定垂直场景紧密结合,大地保险模型应用部署过程无须人工介入和适配,效率提升80%,准确率及智能体应用问答效率提升近30%。

目前,蚂蚁数科累计已服务100%的国有银行和股份制银行、超60%的地方性商业银行、数百家金融机构。

“AI 虽然离全面替代人工还有很长一段距离,但是利用AI赋能业务发展的趋势和方向是毋庸置疑的。我们判断,AI对人类社会的影响会越来越大,商业银行与AI的连接,不是一个‘要不要’的问题,而是‘怎么用’的问题。”中国农业银行股份有限公司副董事长、执行董事、行长王志恒近期对外表示。

王维强调,如今已经进入企业级智能体爆发之年,蚂蚁数科会逐步覆盖且深化金融场景,帮助客户解决业务场景的难题,让大模型在金融业从“可用”到“好用”,加速大模型在金融业的规模化价值落地,“这是一场没有完成时,只有进行时的长跑”。(本文首发于钛媒体App,作者|林志佳,编辑|盖虹达)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
清算终于开始了!一个要求,震动东京:中国要求日本限期内归还

清算终于开始了!一个要求,震动东京:中国要求日本限期内归还

来科点谱
2026-01-29 09:00:27
李亚鹏直播再登带货榜首,单场卖茶1.6亿;全程没有套路喊麦,没有疯狂逼单,反劝粉丝“理性消费”

李亚鹏直播再登带货榜首,单场卖茶1.6亿;全程没有套路喊麦,没有疯狂逼单,反劝粉丝“理性消费”

930老友记
2026-01-31 23:01:26
为什么早餐利润这么高大家都不去做呢?网友:走投无路才干这个

为什么早餐利润这么高大家都不去做呢?网友:走投无路才干这个

夜深爱杂谈
2026-02-01 18:55:04
佟丽娅为儿子朵朵庆祝10岁生日,前夫陈思诚罕见出席,朵朵好文雅

佟丽娅为儿子朵朵庆祝10岁生日,前夫陈思诚罕见出席,朵朵好文雅

科学发掘
2026-02-01 09:47:55
难以置信!广东有人在李亚鹏直播间抢购34000多普洱,追问怎么喝

难以置信!广东有人在李亚鹏直播间抢购34000多普洱,追问怎么喝

火山诗话
2026-01-31 11:52:11
价格大跌,广州市民大批涌入,有人一下花掉36万元购买足金饰品!店员:忙到连轴转

价格大跌,广州市民大批涌入,有人一下花掉36万元购买足金饰品!店员:忙到连轴转

环球网资讯
2026-02-01 17:58:53
库里核磁结果出炉!确诊髌股关节综合症 再缺阵7场将无缘评奖

库里核磁结果出炉!确诊髌股关节综合症 再缺阵7场将无缘评奖

罗说NBA
2026-02-01 09:40:36
55年授衔,王建安被毛主席从上将名单删掉,对此王建安是何态度?

55年授衔,王建安被毛主席从上将名单删掉,对此王建安是何态度?

品点历史
2026-02-01 07:45:04
壕无人性,莱巴金娜夺总决赛、澳网两冠入账5648万元人民币

壕无人性,莱巴金娜夺总决赛、澳网两冠入账5648万元人民币

懂球帝
2026-01-31 21:06:26
李在明怒了!

李在明怒了!

新京报政事儿
2026-02-01 12:45:59
随着利物浦4-1,切尔西3-2,阿森纳4-0,英超最新积分榜出炉

随着利物浦4-1,切尔西3-2,阿森纳4-0,英超最新积分榜出炉

侧身凌空斩
2026-02-01 06:15:06
西方国家领导人为何密集访华?BBC记者解读很到位

西方国家领导人为何密集访华?BBC记者解读很到位

潇湘晨报
2026-01-31 22:11:12
小学阶段,最没用的事:家庭总收入连两万都没有,却拼命去鸡娃

小学阶段,最没用的事:家庭总收入连两万都没有,却拼命去鸡娃

好爸育儿
2026-02-01 17:44:08
皇马内讧爆发!姆巴佩公开不满,抱怨没帮手,皇马高层被耍了

皇马内讧爆发!姆巴佩公开不满,抱怨没帮手,皇马高层被耍了

阿泰希特
2026-02-01 12:43:12
30岁女子洗澡时摸到颈部肿大淋巴结确诊肺癌后选择轻生,丈夫无奈:我们本来要二胎!

30岁女子洗澡时摸到颈部肿大淋巴结确诊肺癌后选择轻生,丈夫无奈:我们本来要二胎!

消化石医生
2025-11-29 11:38:20
中国共产党中央军事委员会副主席张升民简历

中国共产党中央军事委员会副主席张升民简历

上观新闻
2025-10-23 18:17:07
中央一声令下,香港特首曾荫权:如果保不住香港,我们以死谢罪!

中央一声令下,香港特首曾荫权:如果保不住香港,我们以死谢罪!

鉴史录
2026-01-31 19:20:59
李思思不容易,为带货跑内蒙古扎麻花辫子扮少女,身材肥硕像大姐

李思思不容易,为带货跑内蒙古扎麻花辫子扮少女,身材肥硕像大姐

乐悠悠娱乐
2026-02-01 09:12:16
国民党中常委选举出炉!陈菁徽最高票,韩国瑜、郑丽文人马也入列

国民党中常委选举出炉!陈菁徽最高票,韩国瑜、郑丽文人马也入列

海峡导报社
2026-01-31 21:50:02
28岁川大博士在意大利失联十余天,姐姐最新发声:弟弟生活节俭四件套用了7年,原计划毕业后到昆明工作,自己正办签证出国寻找

28岁川大博士在意大利失联十余天,姐姐最新发声:弟弟生活节俭四件套用了7年,原计划毕业后到昆明工作,自己正办签证出国寻找

极目新闻
2026-02-01 13:10:29
2026-02-01 19:31:00
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
129210文章数 861743关注度
往期回顾 全部

科技要闻

腾讯元宝宣布:10亿现金红包,今日开抢

头条要闻

老人狱中离世14年后获无罪 孙子专门就读法律专业申诉

头条要闻

老人狱中离世14年后获无罪 孙子专门就读法律专业申诉

体育要闻

锁喉吃红牌+扇耳光 英超15人打群架

娱乐要闻

马年春晚第三次联排,多位明星现身

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

本地
时尚
数码
教育
公开课

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

伊姐周六热推:电视剧《年少有为》;电视剧《有罪之身》......

数码要闻

SSD涨价近3倍!8TB固态硬盘价格近2万 够装一台高端游戏PC了

教育要闻

洪家亮:让“身上有汗、眼里有光”成为孩子的成长常态

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版