来源:2022第三届中小金融机构数智化转型优秀案例评选
获奖单位:浙江民泰商业银行
荣获奖项:数据智能应用创新优秀案例奖
一、项目方案
1.项目背景
商业银行在经营活动过程中,主要面临着信用风险、国家及转移风险、市场风险、利率风险、流动性风险和操作风险等。其中,信用风险无疑是最重要的风险。信用风险可定义为银行的借款人或交易对象不能按事先达成的协议履行义务的潜在可能性。风险经理作为银行信用风险监控的主要力量,其业务素质、风险偏好、反应速度、履岗能力、尽职程度将决定风险监控的效果。
2.项目目标
本项目旨在建设一套功能完整、性能稳定、能够满足行内数据分析和建模人员在线进行模型开发及应用的全生命周期管理需求的系统平台,为营销、风控业务条线的智能化数据分析场景实现提高基础能力。自助建模与模型管理平台(以下简称“模型平台”)具体包括以下内容:
①在该平台上实现模型开发的全过程,以减少线下数据处理、特征工程、模型训练等步骤的工作量,提高建模效率。
②实现模型的集中管理和全生命周期管理。
③借助场景建模的实施,使行内建模人员快速熟悉并可以基于模型平台进行熟练的场景化自助建模。
④建立完善的建模流程机制和模型管理等制度规范。
图1:模型平台功能架构图
3.项目方案
为满足风控模型场景风险需要及建模计算性能压力需求,模型平台采用大数据分布式处理架构,在保证自身可视化建模高效运行的前提下,在渠道业务、应用层、数据层更具有灵活的横向扩展能力。对于大数据计算,模型平台提交给spark进行处理;对于支撑处理渠道业务系统实时高并发请求,模型平台采用本地缓存+分布式缓存方案,最大程度降低对数据库读取的依赖。
模型平台集成了各种常用的算法、三方库和必要的工具集,内置了数个金融行业的经典模板案例,集成常用机器学习库和框架,真正做到“开箱即用”。同时提供完善的计算资源管理,用户之前资源隔离互不影响,并且利用动态资源分配技术最大化平台计算资源整体利用率。
模型平台功能可完整覆盖模型开发和训练、模型部署和运行、模型管理和监控场景下的工作要求,并且功能模块可以灵活组合,满足不同侧重点的项目需求。此外,可根据行内业务上的个性化需求,提供定制开发服务。
模型平台在模型监控层面积累了大量符合业务实际需求的监控模板,可供银行在项目中直接使用,节省大量定制化开发成本。通过监控模板快速配置围绕模型的全套监控体系,可大幅度降低监控维护成本。
二、创新点
模型平台在功能丰富性和平台性能上,可完全满足大型项目多人联合开发需求,既可以为习惯编程的用户提供交互式编程Notebook工作台,也可以为希望“零代码”建模的用户提供拖拉拽可视化建模,不同工作习惯的用户均可轻松上手。同时解决了大数据建模开发周期长、模型管理不完善等问题,使快速、高效的进行模型研发及方便的管理和运营模型成为可能。
基于大数据集群的模型平台,支持统一的特征数据服务,是集成模型构建、模型部署运行、模型预测服务、模型监控、模型全生命周期管理等功能的一站式全业务流程支撑的平台体系和工业级应用产品。
三、技术实现特点
鉴于银行业务复杂性,为保证对业务的支撑能力,模型平台底层采用开放性架构设计理念,能够对接现有行内系统,同时提供快速集成能力,便于自行引入和升级新技术、新框架。具体可满足如下要求:
1.平台采用分布式架构设计,支持本地化部署。
2.基于容器技术的微服务功能模块封装,提供平台功能的快速封装,保证平台功能的开放、可扩展。
3.支持各种主流机器学习、深度学习框架,包括但不限于:Scikit-Learn、Tensorflow、MXNet、Caffe/Caffe2、PyTorch等。
4.异构底层架构,兼容单机环境、分布式环境、GPU环境。
5.响应人实施过程中需遵循我行数据标准、数据接入模式以及数据使用规范。
6.响应人在集成关联系统时,需严格遵循我行接口标准,如统一报文头、统一流水号、统一错误码等。
在整体系统设计原则上, 模型平台系统设计遵循模块化、参数化和标准化原则,建成后系统具备可靠性、开放性、灵活性与可扩展性、易用、易管理和易维护性、可审计性。
性能方面,模型平台在架构层面充分考虑了系统的可扩展性、高可用性和高并发性。大文件存储在hdfs中,保证信息存储不丢失;所有服务都采用ha部署,确保服务高可用;系统有良好的稳定性和可扩展性,服务器节点可以横向任意扩展以满足业务增加的要求。
四、项目过程管理
五、运营情况
模型平台上线后,首先在行内数据管理部专业数据分析人员中推广使用,在积累一定的使用经验和场景经验后,再在全行范围内推广应用。模型平台有两大功能,其中建模功能主要适用于行内的专业数据分析、数据挖掘和计量岗位;模型管理功能适用于全行业务,可进行业务营销和风险模型的全生命周期管理。推广使用过程中,模型运行稳定,平台设计的扩展性和性能得到进一步验证。
六、项目成效
本项目是行内自主研发的产品,具有良好的商业模式和广泛的市场应用前景,产业规模庞大,能够解决行内痛点,是关系数字经济转型的根基所在。一方面提高了大数据建模研发效率;另一方面,借助该平台实现了模型的全生命周期管理,进一步实现了模型的自主可控。未来几年,将会产生更大的经济效益和社会效益,实现更大的经济指标。
七、经验总结
根据麦肯锡预测,2025年中国狭义消费信贷余额相较2020年将翻番,从约15万亿元人民币增至约29万亿元,中国消费信贷市场将逐步转向规范化的成熟经营模式。2020年中国消费信贷市场迎来转折之年。市场面临低利率环境下利润空间收窄、市场竞争加剧以及不良资产快速增长三大挑战。在此背景下,金融科技全面赋能消金价值链,成为其下一个5年的核心竞争力之一。
一方面,国有大行和各家股份制银行早已开始在营销、风控等领域应用模型能力,将人工智能、大数据等技术应用于拉新、客户身份识别、反欺诈、风险预警等实际业务场景。银行的模型资产数量也可以清晰地反映这一趋势,从早年的个位数到目前的百位数,甚至某些大行模型资产数量已经过千。而随着业务发展,银行对模型的精细化要求越来越高,相应投入的人力和财力正在快速增加。另一方面,监管机构对于模型风险的管控要求逐年提高,模型风险管理在银行内部的受重视程度迅速提高,在模型数量迅速增加的未来,模型管理所需的人力和财力投入会是一块较大的成本。
因此,从模型应用效果、模型工作效率、模型管理成本等方面来看,本项目申报的模型平台可以切实帮助银行等金融机构降本增效,并且收益会随着业务发展显著提高。
更多金融科技案例和金融数据智能优秀解决方案,请登录数字金融创新知识服务平台-金科创新社官网案例库、选型库查看。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.