案例名称
厦门国际银行统一运维PaaS平台建设项目
(资料图)
案例简介
厦门国际银行通过建设统一运维PaaS平台,构建运维技术中台能力框架,同时推动行内敏捷运维、运维监控等一系列制度规范的落地,解决了应用版本发布难覆盖、监控告警难精准、配置管理质量差及运维能力转型慢等业内普遍痛点。在运维场景上实现了统一监控、应用版本发布、灾备切换、安全基线扫描、漏洞补丁升级、配置发现、软件批量升级、日志分析等多个功能,有效降低运维操作风险,提高运维效能,并不断提升运维敏捷化与智能化能力。
创新技术/模式应用
我行基于统一运维PaaS平台在运维场景上创新求变,平台SAAS功能覆盖运维安全、批量、敏捷、智能、数据分析等多个运维领域,包括有:
1.应用版本自动发布,构建持续交付平台:
贯穿行内开发-测试-运维的DevOps路径,全自动化将版本管理与部署应用于开发、测试、生产环境。该功能模块支持标准发布、批量发布、灰度发布、容器化发布、SQL发布等多种发布模式,支持行内各类异构系统,支持部署前后的服务健康检查,实现从开发到生产投产的全流程自动化,大幅减少了手工操作耗时,提升了操作准确率,提高了系统的可靠性和稳定性。同时通过自动化部署质量报表强化版本部署的闭环质量管理,提升自动化部署效能与版本质量,提高我行系统的敏捷变更能力,满足业务敏捷发展需要。
2.统一监控建设,融合CMDB能力:
基于平台丰富的数据采集、数据处理以及插件扩展能力,实现对各类应用系统、中间件、服务器、数据库、网络存储等基础软硬件资源的监控告警,并整合业务流程监控、网络流量监控的各类告警信息,实现监控信息的统一管理与处置。同时平台配置资源可消费,实现资源管理与资源告警的一体化闭环。通过集中管理全行告警信息,并采取统一的收敛、屏蔽、关联分析、自动化处理等手段提高告警有效性,减少误告与漏告,实现告警从接入、收敛、处理、分派的闭环管理,提升了告警处理效能,保障系统稳定运行。
3.统一自动巡检,隐患提前发现:
建立全覆盖、自动化的生产环境自动化巡检功能。通过自动化巡检及自动化差异报表、问题报表等手段,辅助运维团队每日全面了解各类软硬件资源的生产健康状况,从全量的生产系统中提前发现问题隐患,以便提前排除风险点,避免隐患最后转化成问题,从而保障生产系统运行稳定。
4.运维数据分析,助力数字化转型:
面向数字化运维场景,开发运营分析功能,批量对业务系统进行交易接口级的交易性能分析、报错码分析和可视化展现,帮助系统运维人员全面地、实时地监控和观测行内系统的交易健康情况,并对交易过程中出现的异常,包括失败率、无响应率、耗时、TPS等关键系统健康指标进行智能预警,帮助运维人员快速发现系统问题并及时采取措施,从而提高系统的稳定性和可靠性。
运维团队立足我行实际运维需求,不断迭代升级平台功能场景,从而实现高效、敏捷、智能的运维能力,提高科技运维工作的业务价值。
项目效果评估
1.统一的自动化赋能为精益生产管理和信息化发展提供有力支撑:通过统一运维PaaS平台的建设,实现批量化生产配置和模块化操作,一方面节约人力成本,目前我行测试、生产环境的部署工作都已实现了自动化,有效释放了运维人力;另一方面也以平台赋能的形式,极大提升了生产维护的标准化程度,为生产环境的稳定运行提供了有力保障。
传统发布模式下,需多人登录数十个应用终端,由运维人员手工执行作业。而通过平台的一键版本部署,极大节约了时间成本,平均每个部署作业节省人工操作0.5小时。平台功能上线至今生产环境共执行10000+自动化部署任务,共计节省人工操作时间5000+小时,测试环境共执行了40000+任务,共计节省人工操作时间20000+小时。
2.响应监管机构要求,提升运维统一监控能力:在金融机构应用数量与日俱增,应用架构趋于多样化和复杂化的背景下,为响应监管对金融科技问题的“早预警、早发现、早处置”要求,提高业务的稳定性和连续性,我行建设统一的监控告警功能,实现了告警维度和告警精确度提升的同时,满足一站式监控应用、数据库、云平台、容器平台、基础资源及安全监控的需求,以统一的视角洞察应用和资源的健康状态,保障业务稳定安全运行:
·完成4000+台虚拟主机纳入监控,覆盖全行300多个业务系统;
·具备高性能高并发的日志采集监控、日志检索及分析能力;
·构建了运维全监控告警统一纳管模式,告警指标覆盖度有了极大的提升,扩展包括OS及中间件、数据库指标等重要运行指标,且具备可扩展的告警源集成管理能力,告警事件全生命周期管理。
3.构建自动化运维中台,为运维数字化转型奠定基础:自动化和智能化已成为运维体系发展的大趋势,统一运维PaaS化平台架构,助力运维管理更加精细与高效。基于平台架构的灵活性、扩展性,可支持快速扩展运维新场景需求,并统一收集各类运维场景数据,辅助运维数字化分析,为运维数字化转型奠定坚实基础。
4.运维人员向“运维+研发”的复合型人才转型,响应新时代发展人才发展要求:依托平台的开发框架支持,运维人员逐步转型,提升了运维开发能力,由专门的团队负责平台运营管理和产品研发,与应用运维、基础运维和安全运维等团队配合,赋能运维敏捷、运维数字化能力,共同推进我行的数字化转型。
项目牵头人
刘锴 经理
项目团队成员
黄萍、刘伟旭、林彦彦、林建庭、王君德、李福顺、吴伯彦、吕志翔
责任编辑:王超
关键词: