网易首页 > 网易号 > 正文 申请入驻

金融推理大模型价值初探:能否成为行业智能体下一“风向标”?

0
分享至

2025世界人工智能大会上,大模型、智能体毫无疑问是最热话题。当大模型和智能体走向规模化应用,如何将它们的巨大潜能,真正转化为驱动产业升级的、可信的生产力?答案或在于,更垂直、更专业的方向转变。

7月28日,在"智能体驱动产业变革"论坛上,蚂蚁数科正式发布金融推理大模型Agentar-Fin-R1,为金融AI应用打造"可靠、可控、可优化"的智能中枢。这是国内首个专注金融推理的商业化大模型。在蚂蚁数科看来,金融推理大模型是金融AI智能体发展的关键一步,它将推动金融行业向更智能、高效的方向发展。


让智能体更"懂行"

"当以大模型和智能体为代表的AI浪潮来临,其将深刻改写产业运行的逻辑,而数字化程度最高、数据密度最大、AI应用场景最丰富的金融业,无疑是AI率先落地的绝佳行业。"蚂蚁数科CEO赵闻飙如是说道。

首先需要明确的是,何为AI智能体?甲子光年创始人张一甲解释道,其本质就是把模型的"超级大脑"和自动化的"敏捷双手"结合在一起,大脑思考,双手调用工具、执行任务。业内一致认为,智能体将驱动产业颠覆性的变革,尤其在科技创新与产业创新深度融合的战略框架下,智能体是金融业数字化转型的关键推手。

作为将大模型"大脑"的认知能力转化为具体金融业务执行力的"行动者",智能体的应用也需要更"专"。赵闻飙指出,AI智能体产业价值的释放,关键在于"水平通用"向"垂直专用"的战略转变。智能体的价值不在于解决1000个浅层问题,而在于攻克行业的深层痛点,智能体要围绕场景出发,要深入企业的业务场景,将专业领域知识的价值最大化,才是产业落地的关键。

也正因‌大模型是智能体的核心智能引擎,只有深度理解行业的大模型,才能让智能体真正"懂行",贴近一线,创造真实的业务价值。然而,大模型在金融领域的应用持续深化,在实际业务场景中,往往需要高度专业的金融知识、复杂的业务逻辑推理能力以及严格的金融级安全合规等要求,现有的大模型在解决实际金融任务时仍然存在诸多挑战。

更先进的金融推理大模型呼之欲出。"一个好的垂直大模型,特别是推理能力很强的大模型,才能成为一个智能体可控、可靠、可优化的智能中枢,没有这个东西就像机械设备没有关键的齿轮。"蚂蚁数科CTO王维强调,推理大模型产生的推演能力、泛化能力、意图识别能力、结构化表达能力,是企业愿意用新技术取代原有业务模式、创造增量价值的基础。

蚂蚁数科AI技术负责人章鹏也表示,推理大模型能解决通用大模型在金融领域的局限性。在与客户(采购大模型产品的金融机构/企业)的接触实践中发现,客户需要知道模型的思考过程,需要可解释的结果,而推理模型恰好能满足这一点。

三个"E"的经验

对于金融推理大模型的特点,王维将其总结为三个"E":高质量数据(Excellentdata)、持续迭代(Evolving)以及兼顾数据和训练消耗的工程观以解决效率(Efficiency)问题。

什么样的数据才可被称为"高质量的"?章鹏指出,需满足多个条件。"首先要来自真实的问题,我们会对真实线上问题做一定改写;其次要保证问题的多样性,涵盖金融标签体系的不同业务和属性,并有多样的问法;再者,要对推理思维链进行精简,注入专家知识以符合金融规范,还要校验推理的正确性。"此外,这些数据需要金融专家进行标注和校验。

据悉,蚂蚁数科构建了业内最全面与专业的金融任务分类体系,包括6大类、66小类场景,覆盖银行、证券、保险、基金、信托等金融全场景。基于千亿级金融专业数据语料,通过可信数据合成技术以及结合专家标注的金融长思维链(CoT)构造机制,显著提升模型处理复杂任务的能力,让大模型"天生懂金融,出厂即专家"。

在工程化与迭代方面,王维提到,模型需要经过充分的知识引入、微调和加训才能解决金融严肃场景的问题。从蚂蚁数科的经验来看,是"两阶段加训"的过程,第一阶段在蚂蚁内部进行大规模训练,让模型具备强大的金融基础能力;第二阶段针对具体业务场景和客户需求进行本地微调。

建立一套高频的敏捷迭代机制更为关键,能够确保持续发现模型中的问题和缺陷,快速修复以提升用户体验。在这背后,一方面需要密切关注线上数据,定位模型的实际表现;另一方面要紧密追踪金融动态、市场的调整以及产业结构和产品的变化,不断完善任务体系,识别模型可能存在的能力的盲区。

"最终,通过训练与评测一体化联动,以高效生成的训练数据,驱动模型持续进化,确保知识常新、能力在线,能够更贴合金融业务的实际需要。"王维总结道。

走向金融业务深水区

"智能体高峰将至。推理大模型能力越来越强,更多原来解决不了或者原来解决不够好的金融场景中的问题,将会被列为接下来重点推动的任务清单,这一过程将加速到来。"对于金融推理大模型的前景,王维充满信心。

市场需求验证了这一观点。王维表示,金融推理大模型的出现是必然的,因为金融复杂场景需要清晰的推理链条和逻辑。金融对错误的容忍度低,一个不能理解行业的大模型无法满足需求,不同金融机构有不同的业务禀赋和偏好,需要推理大模型去学习这些行内知识。

"金融机构的客户需要知道大模型的思考过程。因此,开发者永远要走在市场最前线。另一方面,成本和效率也是考量因素,客户很难接受满血版模型的高成本,而推理大模型能根据问题复杂程度调整,平衡成本和效果",章鹏说道。

蚂蚁数科金融AI产品总经理曹刚也提到,目前金融AI应用在通用领域较多,业务深水区渗透率低,而从通用走向业务场景深化是大方向,推理大模型会是重要推动力。

不过正如王维指出金融推理大模型需持续迭代,相关探索远未到终点。在王维看来,当前阶段,模型的更新仍是以技术驱动为主,技术需要先解决成本、效率问题,才能让需求真正被激发。当技术越过拐点,场景效果足够好时,市场因素会更主导。

展望未来,王维相信推理大模型会让智能体在更多金融场景中发挥作用,"从解决70%到80%的问题,再到有些能解决99%甚至100%,这是一个持续演进的过程"。当然不可忽视的是,要认识到技术的局限性,"大模型是Nexttoken的预测,对于决策至关重要、损失巨大的场景,不适合让模型直接决策,也要理性看待其能力边界"。

北京商报记者岳品瑜董晗萱

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
很多人不知道:1990年代,中国曾悄悄“取消”过一批职业

很多人不知道:1990年代,中国曾悄悄“取消”过一批职业

历来纵横
2026-01-03 21:10:51
费迪南德:阿尔特塔不会公开表态想执教曼联,但他会认真考虑

费迪南德:阿尔特塔不会公开表态想执教曼联,但他会认真考虑

懂球帝
2026-01-06 11:04:08
中美关系一夜生变?特朗普突然一声令下,中国92台起重机被查

中美关系一夜生变?特朗普突然一声令下,中国92台起重机被查

现代小青青慕慕
2026-01-06 08:14:54
女优新有菜引退删除账号,请求粉丝:偶遇就当陌生人

女优新有菜引退删除账号,请求粉丝:偶遇就当陌生人

小雅娱乐八卦
2026-01-06 00:05:06
5年前差点倒闭的车企,逆袭成2025年的销冠?!

5年前差点倒闭的车企,逆袭成2025年的销冠?!

黑马公社
2026-01-05 09:38:16
坚持创新驱动,加紧培育壮大新动能(稳中求进、提质增效 实现“十五五”良好开局)

坚持创新驱动,加紧培育壮大新动能(稳中求进、提质增效 实现“十五五”良好开局)

人民网
2026-01-06 06:41:28
就在刚刚,台湾民众党前主席突然宣布

就在刚刚,台湾民众党前主席突然宣布

忠于法纪
2026-01-05 21:35:01
火箭100-97绝杀太阳 球员评价:2人优秀,6人及格,2人低迷

火箭100-97绝杀太阳 球员评价:2人优秀,6人及格,2人低迷

篮球资讯达人
2026-01-06 11:55:45
中方高规格接待,李在明来京吃晚宴,关键时刻,平壤开始有新行动

中方高规格接待,李在明来京吃晚宴,关键时刻,平壤开始有新行动

南宫一二
2026-01-06 10:24:20
特朗普放话:这次行动不会影响中美关系,因为中国能拿到更多石油

特朗普放话:这次行动不会影响中美关系,因为中国能拿到更多石油

头条爆料007
2026-01-04 05:30:57
外媒:伊朗呼吁美方释放委内瑞拉总统马杜罗

外媒:伊朗呼吁美方释放委内瑞拉总统马杜罗

环球网资讯
2026-01-05 17:20:10
教育部扔下重磅炸弹:2026年开始,全国一律不准再买校外商业试卷

教育部扔下重磅炸弹:2026年开始,全国一律不准再买校外商业试卷

云景侃记
2026-01-06 11:32:59
奥运冠军管晨辰出演短剧,本人发文:能够拿捏

奥运冠军管晨辰出演短剧,本人发文:能够拿捏

红星新闻
2026-01-04 19:22:21
画风正确!哈里王子牵小女孩亮相,莉莉贝特公主就应该大方露脸

画风正确!哈里王子牵小女孩亮相,莉莉贝特公主就应该大方露脸

白日追梦人
2026-01-05 03:30:57
楼市保卫战打响!央媒:房子是最大资产,2026房地产要下猛药了?

楼市保卫战打响!央媒:房子是最大资产,2026房地产要下猛药了?

墨兰史书
2026-01-05 19:20:03
军舰开到家门口,炮口快怼脸上,第一反应竟是:有多少钱赔人家!

军舰开到家门口,炮口快怼脸上,第一反应竟是:有多少钱赔人家!

百态人间
2025-12-17 16:30:23
小米徐洁云致歉!立即终止与相关KOL可能合作!

小米徐洁云致歉!立即终止与相关KOL可能合作!

鞭牛士
2026-01-05 22:21:30
41岁齐溪首晒二胎,1岁女儿脚好大,俩女儿穿姐妹装肤色随王传君

41岁齐溪首晒二胎,1岁女儿脚好大,俩女儿穿姐妹装肤色随王传君

娱圈小愚
2026-01-06 09:45:40
中俄刚说打通图们江,第一个跳出来反对的,一点不让人意外

中俄刚说打通图们江,第一个跳出来反对的,一点不让人意外

闻香阁
2026-01-04 11:16:35
造孽!深圳某公司欠薪半年,老板拉群教员工撸网贷!

造孽!深圳某公司欠薪半年,老板拉群教员工撸网贷!

黯泉
2026-01-04 21:46:31
2026-01-06 12:56:49
北京商报 incentive-icons
北京商报
北京商报社隶属于中共北京市委宣传部,由北京日报报业集团主管主办
270305文章数 299921关注度
往期回顾 全部

科技要闻

速看!黄仁勋万字实录:甩出"物理AI"王牌

头条要闻

邓紫棋的科幻小说"入围"银河奖引热议 其副业不只写作

头条要闻

邓紫棋的科幻小说"入围"银河奖引热议 其副业不只写作

体育要闻

从NBA最菜首发控卫,到NBA最强乔治

娱乐要闻

朱媛媛遗作《小城大事》定档1月10日

财经要闻

丁一凡:中美进入相对稳定的竞争共存期

汽车要闻

让智驾能看懂真实世界 英伟达发布开源Alpamayo平台

态度原创

手机
家居
本地
时尚
数码

手机要闻

年度第一水落石出,vivo五连冠,小米屈居第二

家居要闻

引光之宅 地下室也有生机

本地新闻

云游内蒙|初见呼和浩特,古今交融的北疆都会

冬天穿衣其实很简单!上短下长、加点亮色,高级舒适又耐看

数码要闻

AMD扩充锐龙AI Max+处理器产品线,推出新品Max+ 392 / 388

无障碍浏览 进入关怀版