![]()
2025数字金融服务创新与场景应用案例征集业已启动。为丰富案例评审形式,全面展现数字金融行业风貌,自8月25日起将依投稿时序对投稿作品进行线上展示。相关作品的浏览量、点赞量、转发量及推荐量等数据指标,将作为后续评审的重要参考依据。
每一次观看,都是对行业价值的认同;
每一个点赞,都是对同仁努力的肯定;
每一项转发,都是对行业声音的传递;
案例:
在“数字中国”政策引领下,信创改造项目正密集落地,无论是国有大行还是区域性银行,都力图实现从底层基础设施到上层应用的全面自主可控。同时,随着金融行业数字化转型的深入推进,银行对AI赋能、科技驱动精细化管理和自主信创技术底座的需求日益增长,银行在数据中台、监管报送、智能风控等领域的投入明显增加,由于金融行业对数据安全和处理性能的要求较高,选择安全稳定、高计算性能的国产芯片服务器、操作系统、国产数据库、分布式存储等技术成为银行重点考量的方向;同时,AI大模型在金融领域的应用创新正如火如荼,各家银行在数字化转型中,除了信创改造,金融智能化应用也是重点创新方向。
一、项目简介
华软金科统计数据管理系统是基于鲲鹏处理器、银河麒麟(openEuler系)操作系统、华为DWS(openGauss)数据仓库之上,自主研发的高性能金融数据统计分析应用平台,支持多数据源接入与整合,提供数据建模、元数据管理、数据质量检核、指标库管理、可视化报表、AI智能问数等工具,内置标准化的金融数据仓储模型,支持业务人员进行灵活的金融统计分析、监管数据报送等金融数据应用。
![]()
二、项目解决的主要痛点及优势
该方案能解决银行多方面痛点:一是选择自主信创的技术底座,替代原有非国产化的服务器、操作系统和数据库,实现从底层基础设施到上层数据应用的全面自主可控;二是利用国产分布式数据仓库,替代原有自建主备数仓,解决长期历史数据积累带来的存储成本增高、数据计算性能下降、扩展扩容难的问题;三是建设统一数据分析集市,解决各类数据分析应用底层源数据不一致、重复计算等问题;四是建立统一的元数据管理体系,实现对数据资产的可管理、可追溯,解决业务人员对数据模型的易理解、易使用问题;五是建立统一的数据质量校验模块及数据校验规则库,对源数据、指标数据、报送数据分层校验,持续发现和整改数据质量问题,解决数据质量问题;六是建立统一的指标库,对指标分类、分主题定义和管理,解决原有零散的指标带来的业务口径不一致、加工计算重复、难以多维分析的问题;七是利用的灵活报表定义与分析工具,解决业务人员难以进行灵活数据统计分析、大量手工填报与统计汇总的问题。
基于鲲鹏的统计数据管理系统方案,是一套在金融领域有着重要应用价值的解决方案。该方案依托鲲鹏处理器强大的计算能力、银河麒麟操作系统稳定且安全的运行环境以及华为DWS数仓服务高效的数据存储与处理能力,精心构建起全面国产化的金融统计数据管理系统。在这个系统中,能够实现业务数据处理从数据的采集、传输、存储到分析等全流程的自动化操作。借助自动化流程,大大减少了人工干预可能带来的错误和延迟,提高了数据处理的效率和准确性。同时,该系统还具备强大的灵活性,能够支持灵活的金融分析,无论是对市场趋势的分析、风险评估,还是对客户行为的洞察等,都能提供有力的数据支持。并且,它还能够满足监管报送的要求,确保金融机构能够及时、准确地向监管部门报送所需的数据。此方案优势显著,具有多方面的突出特点:
1.基于鲲鹏架构国产硬件打造软硬一体国产化的服务,并针对兼容性、稳定性、安全、功耗、业务功能、基础性能和业务性能等维度进行了测试验证。方案充分利用毕昇JDK特性,并使用DevKit调优和BoostKit套件 KAE加速,进一步提升系统性能
2.采用华为DWS“一库两用”,同时支撑百万级 QPS 查询和十万级 TPS 事务,满足实时交易与复杂分析的强一致需求,避免两库ETL过程,降低运维成本;底层基于鲲鹏处理器内置多核架构,支持并行计算,与DWS的分布式存储和并行查询引擎结合,实现数据自动分区存储与任务拆分执行,数据查询与计算性能提升数倍,大大缩短原有数据集市批量程序处理时长
3.采用行式存储和列式存储相混合的数据存储结构来构建数据集市数据底座,充分利用行式存储增删改少量数据速度快,列式存储统计分析查询性能高的特点,来构建高效稳定的行列混合存储的数据集市。
整合层和应用层的列式存储表数据按照列进行存储,表列可随时进行插入和删除操作,基于此特性,为指标表的自由插拔式管理提供了技术的可行性,且性能优异。
5.基于deepseek-r1大模型,利用大模型开发工具Dify,开发智能问数工具,实现大模型对数据库表结构的学习和理解,根据业务人员统计数据的需要,AI生成数据统计查询SQL语句,辅助开发人员数据SQL编写,支撑业务人员智能数据分析
三、技术亮点
1. 基于鲲鹏架构,利用毕昇JDK,使用DevKit调优,进一步提升系统性能
统计数据管理系统依托鲲鹏架构国产硬件,打造了软硬一体的国产化服务,并且经过了多维度的严格测试验证,包括兼容性、稳定性、安全、功耗、业务功能、基础性能和业务性能等。这确保了系统在各个方面都能达到较高水准。方案还充分发挥毕昇JDK特性,运用DevKit调优和BoostKit套件KAE加速,进一步提升了系统性能。从数据来看,性能提升了67.1%,操作系统的TPS从优化前的49.6提升到了82.9。这表明基于鲲鹏架构,利用毕昇JDK并使用DevKit调优,能显著增强系统性能。
2.采用AI大模型技术,辅助数据SQL编写,支撑业务智问数
统计数据管理系统采用AI大模型技术,实现业务智问数。基于deepseek - r1大模型,借助大模型开发工具Dify,开发出智能问数工具。此工具使大模型能学习和理解数据库表结构,依据业务人员统计数据需求,AI可生成数据统计查询SQL语句。这极大辅助了开发人员进行数据SQL编写,有力支撑业务人员开展智能数据分析,提升了数据分析的效率和便捷性。
![]()
3.采用行列混合式数据存储技术,保证数据加工和处理的效率
统计数据管理系统依托华为DWS企业级数据仓库服务,采用行式与列式混合的数据存储结构构建数据集市底座。行式存储在增删改少量数据时速度快,列式存储在统计分析查询方面性能高,二者结合构建出高效稳定的数据集市。
在不同层级,存储结构选择各有考量。整合层、贴源层和汇总结果层要求快速加载数据、生成结果与导出数据,因此采用行式存储保证速度;而应用层存在大量表列关联加工计算和数据合并分析,选择列式存储以加快加工计算和保证数据合并分析的速度。 采用行列混合式数据存储技术,能够全方位保证数据加工和处理的效率。
4.采用列式数据存储技术,保证指标表的指标可热插拔
统计历史数据跑批常面临源数据恢复时间长、流程复杂的难题,而我们利用列式存储数据压缩比高的特点,通过关键数据的拉链或历史全量快照处理解决了这一问题。对于要求粒度细的数据,采用拉链处理;对于要求粒度粗的数据,则进行快照处理。像示例中的2025年各时间节点的全量快照和增量拉链,就体现了不同处理方式的应用,有效提升了数据处理效率。
本方案采用列式数据存储技术,为指标表的自由插拔式管理提供了技术支撑。在整合层和应用层,列式存储表数据按列存储,表列能够随时插入和删除。 这种特性具有显著优势,能够让指标表的指标实现热插拔。以客户信息表为例,客户号、客户名称等列可根据需求灵活调整,大大提升了指标管理的灵活性和效率,为数据管理带来了极大便利。
![]()
四、商业模式及市场前景
1.市场定位及目标用户:金融行业、商业银行等金融机构,用于行内金融统计分析、监管数据报送等数据应用需求、信创改造或重建项目、基于大模型智能数据分析项目。
2.市场规模和商业模式:目前信创改造项目正密集落地,无论是国有大行还是区域性银行,都力图实现从底层基础设施到上层应用的全面自主可控;同时,基于大模型的数据分析创新项目也逐步在各个银行推进中,因此,基于信创改造项目契机,面向全国100多家城市商业银行和50家省级农商行,可以提供基于鲲鹏服务器、银行麒麟操作系统、华为DWS数仓服务、统计数据管理系统一体化的统计数据管理替代方案。
3.与鲲鹏的合作方向及目标市场:华为提供鲲鹏服务器、DWS数仓服务等鲲鹏解决方案系列基础设施,华软金科提供统计数据管理系统应用解决方案及产品,面向区域性城商行和省级农商行提供国产一体化解决方案。
文/山东华软金科信息技术有限公司
往期案例
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.