网易首页 > 网易号 > 正文 申请入驻

技术应用 | 大模型在金融领域的应用与安全研究

0
分享至

文 / 上交所技术有限责任公司 陈洪炎 胡跟旺 卓航星

金融领域拥有天然的大量数据积淀,为大模型在金融领域的应用提供了良好的数据基础,因此金融行业大模型相较于其他行业的垂直大模型中落地速度相对较快。同时金融领域大模型的应用场景较多,大模型有助于从不同角度提升原有从业人员及机构的工作效率。大模型在金融领域的实践需要考虑多方因素,除了大模型技术框架对现有金融业务的效率提升以外,金融业务的专业性、严谨性、安全性及合规性要求对大模型在金融领域的应用实践也提出了更加严格的风险防控措施要求。

大模型的发展与应用

1.大模型架构。大模型最早诞生于自然语言处理领域,最开始自然语言模型通过神经网络预测单词,加入注意力机制后,使单词之间建立关系而考虑整句语言的含义,从而建立Transformer架构。谷歌和微软分别针对Transformer的编码部分以及解码部分进行研究从而产生了两条技术路线,即以BERT为代表的仅用编码器部分的路线和以GPT为代表的仅用解码器部分的路线。BERT与GPT都用到了预训练范式,预训练范式是指利用大量的数据训练一个基础模型,然后在下游任务上进行一点微调就能够在相应的任务上得到很好的性能表现。通过不断叠加数据并增加模型参数规模以及优化模型的提示工程,不仅可以解决更复杂的任务,同时也拥有了更强大的文本涌现能力。仅用编码器架构的大模型擅长对文本内容进行分析、分类,包括情感分析和命名实体识别,如BERT。仅用解码器架构通常用于序列生成任务,如文本生成、机器翻译等需要生成序列的任务,如GPT。为结合编码器和解码器的优点,出现了编解码器架构如T5和GLM。为了解决仅用解码器架构时内存占用高、响应慢等问题,微软提出双解码器Decoder-Decoder新型架构YOCO(You Only Cache Once),两个解码器分为自解码器(Self-Decoder)和交叉解码器(Cross-Decoder)两部分,以此来降低内存开销,提高性能及吞吐率。

2.大模型在金融领域的应用。随着硬件能力发展,算力已满足大模型的计算要求,大模型逐渐进入公众视野,大模型应用迎来了蓬勃发展,并在媒体影视、电商、广告营销、游戏、医疗、教育及金融等各行各业中得到广泛应用。大模型浪潮爆发后,国内各企业纷纷推出自研大模型。金融领域拥有天然的大量数据积淀,从而为大模型应用提供了良好的数据基础,大型科技企业如华为推出了盘古金融大模型,蚂蚁集团发布了金融大模型AntFinGLM。

金融行业的专业性、严谨性、合规性等特点,在把大模型技术应用到金融领域面临挑战,如:通用大模型的缺乏金融专业知识,通用大模型缺乏金融情境下上下文理解能力,通用大模型无法满足金融合规及监管等要求。金融机构在应用大模型到金融业务场景的过程中,一般需要经过两个主要步骤:一是从通用大模型进一步训练调优出专业的大模型;二是以大模型为核心,结合金融专业知识库、金融专业工具库、智能体、安全合规组件等构成一个可满足金融领域安全应用要求的应用系统,来支撑在金融大模型各场景中的应用。

3.金融大模型的开发框架。通用大模型在金融领域的适配一般需要经历数据收集、数据处理、在金融语义语境中训练通用大模型、参数微调、提高复杂推理能力、优化性能、减少幻觉、模型部署、模型评测、模型应用等流程。金融大模型开发框架(见图1)大致分为5个层次,即数据层、训练层、部署层、推理层和应用层。

(1)金融数据收集。金融数据收集包括预训练数据、金融指令和安全数据。预训练数据主要包括广泛金融背景知识、语义语境认知等金融语料。预训练数据来源广泛,数据格式多样化,一般需要支持多模态输入处理。金融指令包括金融术语、指标计算、规范等专业知识。安全数据是为了满足安全合规要求,为保证大模型输出内容符合金融安全底线,遵从金融价值观而提供的必要输入数据。

(2)微调技术。从大模型参数规模来看,大模型微调分两种技术:一是全量微调(FFT),是对模型的所有参数进行训练;二是高效参数微调(PEFT)仅对部分参数进行训练。在金融大模型训练中较常使用的是PEFT,PEFT可以解决FFT带来的问题,即:FFT的训练成本很高,一般大模型的参数量较多,FFT相当于对模型进行了一次重新训练,FFT进行全参重训之后的大模型能力可能会变更差。PEFT的目的是能够在可控成本的前提下,尽可能地提升大模型在特定领域的能力。

(3)思维链增强。思维链(Chain of Thought,CoT)是通过让大模型逐步参与将一个复杂问题分解为一步一步的子问题并依次进行求解的过程,通过构建模型来模拟人类思考过程,形成一个连贯并符合逻辑的思维过程。CoT被认为是一种开创性且最具影响力的提示工程技术。但传统的CoT一般是线性链式结构,这限制了金融大模型在处理复杂金融领域任务时的推理能力,因此需要采用思维链增加技术(见表1)来提高推理能力。

表1 思维链CoT增加技术

(4)智能体。智能体是指能够自主感知环境、做出决策并执行行动的系统。智能体具备自主性、交互性、反应性和适应性等基本特征,能够在复杂多变的环境中独立完成任务。金融领域智能体可以分为三大模块:感知、记忆和行动。感知是从外界获取信息,记忆是存储知识、处理信息并做出决策,行动是向外界反馈信息。智能体自我反思是对智能体之前的活动进行回顾性思考,以纠正之前错误认知并完善行动决策。

金融大模型安全

大模型在金融领域的实践需要考虑多方因素,除了大模型技术框架对现有金融业务的效率提升以外,金融业务的专业性、严谨性及合规要求对大模型在金融领域的应用实践也提出了更加严格的风险防控措施要求。金融大模型安全挑战主要分为内生安全及应用安全。内生安全是金融大模型在研发过程中设计的基础设施、数据、模型、算法、训练过程、部署等环节中遇到的安全风险,而应用安全是金融大模型的不合理应用、滥用或恶意使用而引入的决策失控风险。内生安全问题应由大模型研发团队关注,应用安全则需要法律法规和行业管理规范来监管和控制。

1.金融大模型内生安全。金融大模型的研发生命周期可分为数据收集处理、模型训练、模型部署和模型落地应用四个阶段。其中数据收集处理阶段主要收集、处理、储存大模型训练需要的预训练数据、安全数据和金融指令等;模型训练阶段对海量数据进行预训练、调参、对齐、构建智能体等;模型部署是将训练好的大模型适配特定的硬件资源,并尽量提高大模型的实时性和推理效率;模型落地应用是用大模型解决各种实际的金融任务。

金融大模型的内生安全风险在不同的生命周期阶段有所不同,也有部分安全风险贯穿在全研发生命周期中(见表2)。在数据收集处理阶段,潜在数据泄漏、数据投毒等风险;在模型训练阶段,潜在后门攻击、数据泄漏、数据污染、模型篡改、模型窃取攻击、AI组件漏洞等风险;在模型部署阶段潜在平台漏洞、硬件漏洞、供应链投毒等风险;在模型落地应用阶段,潜在事实性错误、隐私泄漏、提示注入、对抗攻击、内容安全、大模型滥用、伦理安全等风险。

表2 金融大模型常见内生安全风险举例详解

2.金融大模型内生安全应对。金融大模型的安全风险多种多样,既有模型内部天然具有的不安全性,如数据泄露、隐私安全等风险也有外部的恶意攻击、大模型滥用等风险。为提升金融大模型的安全性、可靠性、公平性、隐私性、可解释性和鲁棒性,需要有相应的安全应对策略。内生安全应对可以从提升数据质量、强化模型学习、减少幻觉、安全评测和提升硬件安全等几个方面进行研究,以保证金融大模型的数据安全稳定、算法可解释、模型决策可信,应用合法合规和环境安全可靠。对于外部风险主要由国家法律法规和行业管理规范来进行监管规范。金融大模型安全框架是从全局视角剖析大模型训练、生产及应用中存在的安全风险问题,为大模型的研发及应用提供安全指导,其安全目标是构建可信、可控、可解释、可溯源的金融大模型,安全框架(见表3)主要包括大模型安全管理、数据安全、模型安全、环境安全和攻防安全。

表3 金融大模型安全框架内容详解

总结与展望

当前金融大模型发展尚不成熟,面临着诸多安全隐患与风险。可以预见,随着深度学习技术的发展和研究逐渐深入,未来大模型的攻防将在动态抗衡中不断升级,金融大模型需要应对的新型安全威胁将不断涌现和升级,建立完善统一的大模型安全评估框架、探索有效的防御机制、实现金融模型安全监管和可控生成,以及促进大模型安全生态的建设等任务迫在眉睫。

(此文刊发于《金融电子化》2024年10月上半月刊)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
雪上加霜!上海硬刚撕下漳州杨梅“遮羞布”,喊话漳州引刀自宫

雪上加霜!上海硬刚撕下漳州杨梅“遮羞布”,喊话漳州引刀自宫

长江浊酒客
2026-05-26 22:00:03
导弹还是捣蛋?俄军两枚“榛树”先后脱靶,8千万美元打了寂寞

导弹还是捣蛋?俄军两枚“榛树”先后脱靶,8千万美元打了寂寞

史政先锋
2026-05-26 20:53:29
男子早餐买4个包子付款21365元,老板守店20天等失主未果后报警寻人!乌龙竟是熊孩子拨弄收款机所致

男子早餐买4个包子付款21365元,老板守店20天等失主未果后报警寻人!乌龙竟是熊孩子拨弄收款机所致

环球网资讯
2026-05-27 07:15:19
NBA官宣:绿军37岁少帅马祖拉获年度最佳教练 创52年最年轻纪录

NBA官宣:绿军37岁少帅马祖拉获年度最佳教练 创52年最年轻纪录

醉卧浮生
2026-05-27 08:12:53
“湿度快赶上亚马孙雨林了”,南方城市有居民连夜购买除湿机,电商平台湖北地区订单暴涨5倍

“湿度快赶上亚马孙雨林了”,南方城市有居民连夜购买除湿机,电商平台湖北地区订单暴涨5倍

极目新闻
2026-05-26 19:26:18
钱从哪里来?拆解追觅科技的资本谜局

钱从哪里来?拆解追觅科技的资本谜局

YOUNG财经
2026-05-26 21:55:18
航天员黎家盈年收入多少?回来后享受什么待遇?

航天员黎家盈年收入多少?回来后享受什么待遇?

混沌录
2026-05-26 22:05:52
比预制菜更恐怖的,是被科技狠活承包的现制餐

比预制菜更恐怖的,是被科技狠活承包的现制餐

蓝鲸新闻
2026-05-25 19:47:39
尴尬!广东一业主因邻居大姐房事声音过大不堪其扰,声称要去录音

尴尬!广东一业主因邻居大姐房事声音过大不堪其扰,声称要去录音

火山詩话
2026-05-26 06:21:30
杀人诛心!穆里尼奥皇马首签锁定!强挖 1.2 亿英超王牌

杀人诛心!穆里尼奥皇马首签锁定!强挖 1.2 亿英超王牌

奶盖熊本熊
2026-05-27 04:55:25
大润发之父尹衍樑去世 享年76岁:曾推动组建北京大学光华管理学院

大润发之父尹衍樑去世 享年76岁:曾推动组建北京大学光华管理学院

快科技
2026-05-26 16:48:29
大润发创始人今日去世

大润发创始人今日去世

中国基金报
2026-05-26 18:02:51
小学生大巴车在高速上出问题,老师让男生留在车上,让女生搭车离开

小学生大巴车在高速上出问题,老师让男生留在车上,让女生搭车离开

可达鸭面面观
2026-05-26 18:25:56
美国公布月球基地建设路线图

美国公布月球基地建设路线图

新京报
2026-05-27 07:37:24
暂停个人外汇买卖,究竟释放啥信号?是不是以后个人都不能兑换外汇了?

暂停个人外汇买卖,究竟释放啥信号?是不是以后个人都不能兑换外汇了?

次元君情感
2026-05-27 00:25:10
王鹤棣客栈风波发酵,实探“棣爸油炸”:其父称最近生意降四成,每天仅百单 不希望儿子太压抑

王鹤棣客栈风波发酵,实探“棣爸油炸”:其父称最近生意降四成,每天仅百单 不希望儿子太压抑

红星新闻
2026-05-26 20:56:10
张雪太给馆长面子!拿出珍贵的冠军香槟喝一半,馆长双手合十感谢

张雪太给馆长面子!拿出珍贵的冠军香槟喝一半,馆长双手合十感谢

火山詩话
2026-05-27 06:23:41
巴拿马世界杯名单身价:全队3400万,迈克尔-穆里略700万最高

巴拿马世界杯名单身价:全队3400万,迈克尔-穆里略700万最高

懂球帝
2026-05-27 06:23:11
凌晨2点打电话叫醒村民的“谢会计”遇难,妻子弟弟仍失联

凌晨2点打电话叫醒村民的“谢会计”遇难,妻子弟弟仍失联

红星新闻
2026-05-26 17:26:13
莎拉高举反华大旗,两周三度喊话军方,彻底推翻老杜六年外交布局

莎拉高举反华大旗,两周三度喊话军方,彻底推翻老杜六年外交布局

健身狂人
2026-05-26 18:45:11
2026-05-27 10:19:00
金融电子化 incentive-icons
金融电子化
中国金融信息科技类主导期刊。
2475文章数 523关注度
往期回顾 全部

科技要闻

美光股价大涨超19%,市值破万亿美元

头条要闻

两儿子均非亲生 "人生很失败"男子起诉前妻要讨回房子

头条要闻

两儿子均非亲生 "人生很失败"男子起诉前妻要讨回房子

体育要闻

摩洛哥队世界杯26人名单:总身价4.7亿 中超旧将入选

娱乐要闻

台媒贴脸!S妈被问大S嗑药当场沉默

财经要闻

ST岩石退市背后:A股“炒壳”时代终结

汽车要闻

涉水加强 福特烈马亚马逊限量版上市 售价39.98万

态度原创

旅游
数码
手机
艺术
军事航空

旅游要闻

绿城相伴 和美宜居

数码要闻

消息称英特尔首批掌机处理器Arc G3系列即将解禁,有望明日发布

手机要闻

苹果iOS 26.6 Beta 1更新汇总:屏蔽超2万联系人后发出提醒

艺术要闻

蒋中正篆书有功夫却欠传统韵味,初学者为何觉得古人书法丑

军事要闻

多国接到撤离警告 俄升级对乌报复性打击

无障碍浏览 进入关怀版