来源:鑫智奖·2025第六届金融机构数智化转型优秀案例评选
获奖单位:太平洋寿险
荣获奖项:专家好评TOP10优秀案例奖
一、项目背景及目标
面向太保寿险“形成标准化的应用系统生产体系”中对一个开发平台和一套交付流水线的技术目标,确立向云原生研发体系方向演进的目标,通过建设符合太保寿险实际情况的稳敏兼顾的云原生研发体系来支撑“两个一”所要求的战略目标。参考国家信通院《云原生能力成熟度模型》做为体系建设的参考模型,评估和指导规划和实施,确保整个建设过程的全面性、有效性和先进性。
二、创新点
1.弹性可伸缩
资源100%容器化;
容器及服务节点按需扩容,提高资源使用率;
资源扩容自动化,减少人工操作,提升突发流量场景的响应能力。
2.系统可观测
建立统一的监控管理体系;
丰富监控维度和监控指标;
监控数据分角色管理。
3.服务可治理
完善应用限流策略;
完善应用降级策略;
完善应用扩缩容策略。
4.能力可共享
沉淀标准化方案:将服务治理体系沉淀至云原生平台,如服务限流等;
沉淀非业务能力组件:通用能力沉淀至云原生平台,如弹性能力、可观测能力、灰度能力。
二、项目技术方案
1.技术架构和特点
太保寿险基于腾讯云Tencent TCS(Tencent Cloud-native Suite,腾讯专有云PaaS平台)并纳入信创新云来整合容器、微服务、缓存、消息队列等PaaS服务,实现一体化集约化管理,解决当前在平台及交付流水线方面存在的问题,进而实现打造云原生体系的总体目标。
①太保寿险云原生技术底座基础能力
针对应用运行进行日常运维,包括扩容、升级、回滚等,可实现资源管理、运维保障、应用服务及服务治理等“一个开发平台”能力建设,具有高性能、高可靠的特性。
②太保寿险云原生技术底座PaaS能力
融合多个PaaS组件,如数据库、消息队列、分布式任务、API网关等,可实现配置管理、持续集成、测试管理等“一条流水线”能力建设,实现业务的快速交付,大大提高了业务效率。
2.部署架构
太保寿险部署环境为海光C86虚拟机,统信UOS V20,鲲鹏arm操作系统,一期虚拟机规模600+,涉及开发测试、生产和灾备环境;
总体资源规模为11391核CPU、36252GB内存、500950GB存储。
3.方案亮点和技术创新
基于信创云(海光 C86、统信 UOS V20)双AZ+仲裁的基础设施,建设符合太保寿险的双活一体化平台,采用了先单 AZ 部署而后平滑扩展为双 AZ 部署的实施路径;
通过定制节点池能力,打通PaaS与IaaS间的弹性伸缩能力,支持太保新云云服务器资源弹性扩展至 PaaS 平台的 K8S集群中,实现CA+HPA+VPA的统一弹性体系建设;
通过支持太保新云ENI弹性网卡的CNI,提供部署的容器集群网络与新云虚拟机同一网络平面打通能力,实现了基于VPC-IP的underlay网络和基于IPIP的overlay网络在同一个集群内统一提供;
通过建立微服务治理的标准技术体系,包含服务治理和灰度发布等多个方面,一是通过运用技术平台的服务治理能力,识别关键服务,并对其建立服务限流、服务熔断降级等保护策略;二是结合PaaS平台全链路灰度与路由功能设置应用的灰度标签,自动将流量分发至对应部署组;
通过可观测体系的建设,完成调用链统一整合、日志统一采集、告警统一配置。一是基于统一全链路追踪实现基础链路数据,多维度链路数据关联,链路数据聚合分析;二是基于统一日志系统实现对于平台自身相关组件、集群、主机、容器、上层应用和中间件日志的采集、分析和展现;三是通过统一云原生平台建设完备的监控系统,实现从指标的采集、分析、处置一体化流程处理。秒级监控,1分钟告警,快速发现问题;
通过基于混沌工程能力建立寿险旁路验证体系,降低变更对生产环境造成的风险,从而保障寿险核心业务的稳定运行。同时提供了一个低风险的变更实施平台,使变更管理更加规范化和可控,大大减少了变更导致的事故,提高服务质量和业务价值;
分布式调度体系建设,基于云原生技术底座 提供更多能力的增强,包括任务混合编排、支持更多的任务类型(Springbatch、crontab)、权限优化、横向扩容能力等。
三、技术优势
1.赋能科技团队应用快速标准上云
微服务统一治理,建立统一技术管理标准及技术栈,提升系统科技能力;
建立Devops标准体系,规范研发交付流程,提升需求交付能力。
2.提升运维工作自动化率
系统可观测,秒级告警,高效定位故障;
极致的弹性伸缩,提升应用资源利用率。
四、项目过程管理
五、运营情况
太保寿险新一代统一客户中心系统完全遵循云原生架构设计规范打造,通过采用容器化+微服务+分布式技术+API服务化架构,从根本上实现了业务系统服务化理念,新一代客户中心系统运行在TCS容器平台之上,依托TSF微服务框架,使用了PaaS组件级能力,如消息队列、缓存、服务治理等。目前对接了承保运营中心,保全运营中心,通用运营中心的多个业务运营系统,当前平台调用数量已经超过2.7亿次,接口性能提升超过50%,应用版本的发布效率提升了30%,在资源使用方面则释放80%闲置资源。
六、项目成效
从传统架构逐步转向云原生架构,通过容器、DevOps及微服务技术平台的建设,从手动、落后的研发模式逐步迈向自动、弹性、高效、先进的研发模式,提升交付质量,更好的支撑业务发展。
1.PaaS纳入新云与应用信创支持
1)完成寿险PaaS平台与集团新云资源底座的集成,当前寿险约80+系统完成微服务改造,并迁移上云;
2)实施成效
CPU平均使用率提升25%;
应用初始化资源配置减少50%。
2.可观测体系建设
1)通过建立可观测体系的建设,完成调用链统一整合、日志统一采集、告警统一配置,数据链路一体化展示,当前完成10大类数据源及30%的应用的接入,监控指标高达20种以上;
2)实施成效
问题提前发现率提升20%;
告警触达秒级;
问题定位时间减少20%。
3.高级服务规范制定与试点
1)建立应用限流、熔断模型,并对应用进行服务治理,增强系统在线稳定性,提升客户体验,打通DevOps平台灰度发布流程,建立灰度发布指南,完成应用试点;
2)实施成效
完成8个系统、三个活动的服务治理;
打通DevOps平台灰度发布流程,完成应用试点
弹性扩缩容推广率100%。
4.研发效能提升
1)根据寿险现状制定DevOps流水线使用规范,指导和规范研发过程,后续将对规范形成寿险专有流程,通过流程化、模板化管理从而提高研发效能及交付质量;
2)实施成效
研发规范推广100%;
上云应用发布效率提升85%;
上云应用需求交付时效提升20%;
信通院贯标达成三级。
七、经验总结
采用国产全栈云原生技术,实现技术架构从传统到云的转型,提升科技能力。
构建行业领先的云原生技术平台,优化科技生产流程,提高资源利用和应用交付效率。
建立智能、高效的运维体系,实现流程自动化,降低成本,支持业务发展。
项目成果为保险行业打造可推广的数字基础设、推动数字化转型树立了标杆,符合国家科技创新和自主可控战略。
更多金融科技案例和金融数据智能优秀解决方案,请在数字金融创新知识服务平台-金科创新社案例库、选型库查看。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.