查看原文
其他

实战 | ​​运维基础能力中台化,营造场景建设生态圈

金融电子化 金融电子化 2022-09-24

欢迎金融科技工作者积极投稿!

投稿邮箱:newmedia@fcmag.com.cn

                                           ——金融电子化

文 / 中国农业银行数据中心运维自动化与智能化课题组

当前,在数字化转型的大背景下,农业银行数据中心面临着“平稳、安全、快速、精准”的生产运行保障要求,生产运维自动化和智能化建设被寄予厚望,在构建IT运维自动化的道路上,农行数据中心坚持正道、坚定方向,笃行务实,守正创新。始终秉持着以解决运维痛点和难点问题为根本,始终坚持技术运维为着力点,务实面对运维中的迫切需求,扎实筑牢运维基础能力,着重培养运维开发能力,以中台化驱动场景化,营造运维场景化自驱建设生态圈。


运维活动管理的场景化营销模式

农行数据中心经过多年以来的探索与实践,将运维活动进行了抽象,基本实现了IT运维全专业的“监、管、控、析”活动能力,但在面对综合性、复杂型运维活动(如多部门协作)时,仅依靠基础运维能力还无法满足综合运维需要。为此,我们将配置、监控、操作、流程、分析和展示等运维基础能力,通过串联配置以及抽象和层次整合,立足专业条线和运维活动的业务特性,构建出统一的运维入口,来满足专业性、综合型运维管理需求。构建的过程即是运维活动的场景化过程。通过中台整合和场景积累,构建全新的运维体系,这是运维活动的必然演进方向。


运维业务中台是场景化运维的必要支撑

将运维通用功能和数据以服务的方式提供,构建运维的共享支撑中台,在其上持续建设自动化操作、可视化展示和运维门户等管理应用,体现中台为上层应用场景提供消费调用的价值。强有力的中台支撑是场景化运维的必要条件,运维中台是思路和机制,核心要素主要由以下几方面内容构成。


1.采控中台。采用分布式统一采控体系,通过统一代理框架实现各类资源的配置发现、指标采集、自动化操作,向上提供开箱即用的服务化接口。采控代理由采控服务端逐级指挥,实现大规模一体化采集和操作控制。同时,统一采控体系易于扩展,例如针对F5统一采控管理需求,开发采控代理插件进行功能扩充,快速实现F5统一管理。


2.数据中台。数据中台综合体现了运维数据治理的理念。数据采集层,满足多源异构数据的统一接入,实现灵活清洗与融合;数据处理层内置了丰富的计算算子,采用可视化拖拽定义计算流程;数据存储层统一数据模型治理,提升运维数据质量;数据消费层满足海量数据的多场景数据订阅消费。


3.服务中台。将运维业务基础组件下沉,通过完善的运维API治理和微服务自监控,深层次抽象业务流程共性,形成通用业务服务能力,实现灵活的运维应用搭建,具体组件分层功能如表1所示。


表 1  服务中台分层组件


4.开发中台。提供运维应用开发到上线的生命周期流水线管理,内置代码和构件仓库,提供代码托管和编译构建能力,可基于前后端脚手架快速生成场景化应用基础框架,借助中台已有的能力和服务接口,通关简单开发便可实现运维场景需求,开发中台双态化运营如图1所示。

图1  开发中台双态运营


落地场景化运维的组织条件和技术条件

场景化运维描述了具有特定角色的运维人员对特定的运维对象开展具体的运维活动,包含了对象、活动、角色和场景四要素。农业银行数据中心的场景化运维是以专业化工作台为基本设计载体,通过自上而下的组织推动和自下而上的技术支撑合力互动落地而成的。


组织推动力旨在顶层设计和团队及专业协作,管理层制定战略目标和中长远规划,统筹跨专业领域的组织合作,从全局视角避免执行与规划相偏离,确保每个阶段的实施处于正轨。团队和专业协作要体现专业领域内细分合作和专业领域间融合共振。


技术框架上采用前后端分离开发,运维中台的开发中台提供前后端通用脚手架,可以快速生成可运行的前后端项目,开发人员只需关注业务功能开发。后端项目使用微服务框架,每个运维场景化应用都是一个独立的微服务应用。前端项目可直接克隆脚手架,根据对应的路由配置,将实际业务在视图文件和数据处理逻辑中完成,并对后端的请求调用逻辑,形成了一套常规的开发流程。


营造农行数据中心场景化运维建设生态圈

场景化建设生态以运维中台为基础,运维中台作为开放型社区,提供平台化能力和互动场所,使用方(如SRE团队)在中台上自我实践、自我开发来解决实际运维中的难题,营造出运维各个层面的自驱效应,使用方可以是消费者也可以是供应商,使用方和提供方在互动过程中产生了新的平台价值,形成运维场景建设生态圈。


农行数据中心专业化场景工作台是专业日常运维功能的主入口,是运维生态圈建设实践的载体。依据专业部门日常运维所需要的功能以及共性,逐步将工作台发展成一个运维标准化的承载容器,后续专业相关联的运维能力和运维场景纳入容器管理。这个容器将会在很长时间范围内以满足专业基本运维能力为前提,逐步优化迭代,持续满足各种专业的运维需求。所以工作台也不是一成不变的,变化是基本特点,不变的是不断提升的运维服务能力目标。


农行运维中台驱动运维场景化实践成果

基于运维中台,以场景化建设为抓手,农业银行数据中心已经上线了20余个运维场景,在专业条线工作台、资源快速交付、快速应急处置、流程式生产变更等方面实现了运维自动化,突出表现在以下几个方面。


专业工作台整合条线运维活动,提升整体运维效能。主机、开放、网络、环境、作业各运维条线已打造完成贴合自身运维工作需要,整合制度规范、工作流程、常态与应急态、特殊运维活动场景的综合类运维工作台,在建设过程中,专业条线管理模式和组织机构也同步得到优化革新,运维战斗力大幅提升。


投产资源交付场景,实现快速交付。投产资源交付场景依托云平台,通过流程串联资源申请、资源评估、资源分配及变更、资源生产、配置采集、监控配置、资源交付各环节,实现了一键式提交、一站式交付。与传统虚拟机交付相比,运维人员参与度大幅下降,交付速度大幅上升。


应急处置与切换场景,快速恢复生产。针对基础设施与应用系统总结沉淀应急处置和切换场景,形成应急处置预案与操作流程。应急处置触发后能够迅速启动操作流程,实现故障恢复。以网络条线为例,构建五维态势图,对告警、分区流量、ping检测、重要系统运行情况、近期变更操作进行综合展示,发现异常根据应急处置规则立即启动、执行应急处置,朝着“五分钟异常发现、十分钟故障定位、二十分钟异常恢复”的目标迈进了一大步。


(课题组成员 :中国农业银行数据中心    张乾尊  杨文灏  徐振华  韩子文  徐祺鸣)


(栏目编辑:张丽霞)






往期精选:

(点击查看精彩内容)


● 实战 | IP地址冲突检测方法研究与实践

● 实战 | 基于敏捷模式的分层自动化测试体系建设与应用

● 实战 | 数字孪生技术在数据中心运营场景的应用

● 实战 | SDT智网建设思路与实践

● 实战 | 构建外贸综合服务场景下的联邦链






《金融电子化》新媒体部:主任 / 邝源  编辑 / 傅甜甜 潘婧

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存