电子政务运维管理解决方案

方案概述

大型政府部门中往往存在跨地域、跨平台的分布式业务系统,业务系统的部署和维护困难。该方案不仅可以实现跨域、跨平台资源的管理,在此基础上,负责对所有服务器上运行的软件服务进行自动部署、自动升级、自动配置、可视化管理和实时状态监控,而且还会根据环境和需求的变化,或在异常情况出现之后,对软件服务进行动态调度和自动迁移。

业务挑战

1、在现有的大量跨域、异构的软硬件基础设施上,搭建统一的资源和服务管理调度系统,降低资源管理难度;

2、实现应用系统的资源共享,打破各应用系统的竖井式架构,使用统一IT资源池支持各应用系统的资源需求,提高资源使用效率;

3、对分布式应用服务生命周期的自动化管理,有效降低IT系统的运维成本;

4、复杂网络中单个设备出现故障已经成为常态,系统运维故障率高,难以保证服务的稳定性和持续性,需要提供对故障的自动化处理。

方案描述

方案利用友友系统的NetVM平台产品,在现有的大量跨域、异构软硬件基础设施之上,快速搭建统一的资源和服务管理调度平台,并提供整体解决方案,进行应用服务的高效运维。方案集成了策略引擎、分布式工作流、资源与服务管理调度等先进机制,在搭建高性能的基础设施和应用服务运行平台的基础上,保证资源及服务的延展性、容错性和流动性,从而实现了IT系统整体管理的高效和透明化。

架构图

上图是一个典型的运维管理解决方案逻辑图,从下往上分为如下几层:

1、底层机制层

使用友友系统自主研发的Bitsflow作为底层通讯组件,解决分布式系统中的通讯问题;

使用友友系统自主研发的NetVM作为底层管理组件,解决分布式系统的远程操作问题,以实现在远程节点上的软件管理;

使用友友系统自主研发的Workflow和Dsched构成分布式工作流,来负责工作流的实际执行;

使用友友系统自主研发Jgraph来进行监控数据的收集和监视图片的生成以及告警和运维事件的触发;

通过集成开源的CloudStack来作为虚拟化平台,来进行虚拟机的管理;

使用友友系统自主研发WMI Proxy,来支持对Windows节点的管理。

2、运维逻辑层

使用底层组件,实现资源管理、服务管理以及运维管理等系统级功能。

3、接口层

提供RESTful webservice API,供开发使用。

4、其他

另外还基于接口层实现了一个可视化的控制台、一个工作流设计器(用于用户自定义运维流程)和一个软件仓库(来对软件包、配置包进行集中统一的管理,可以进行包的生命周期管理、依赖关系维护等,并提供一个软件包制作工具)。

方案价值

1、物理资源和虚拟资源的无缝整合和一体化管理

解决方案会将所有资源(计算资源、存储资源、网络资源),根据资源能力和属性进行高度抽象和虚拟化,并通过资源池、管理域等概念和机制进行无缝整合,然后通过统一的资源调度来实现动态分配。这样,不仅可以最大化资源利用情况,还可以使应用、数据和底层资源实现完全松耦合,简化应用服务运维的管理难度。与此同时,方案设计还支持多样化的资源调度策略,通过方案提供的特有的描述框架,可以将资源、服务和运维任务程序化,然后利用基于复杂事件处理的自动化机制,完成部署、配置、监控、故障恢复等各个方面的运维任务。

2、大规模和批量服务的自动化部署

方案提供标准的软件包制作工具(支持多种平台安装:Windows或是Linux/AIX等UNIX风格操作系统),并利用软件仓库功能,实现对软件包的规范管理(上传、删除、升级、版本等)。另外,通过引入全新的构件(软件包之间的组合和依赖关系)概念,以及完成对服务和构件之间的关系视图的构建,方案可实现基于服务的大规模应用服务的安装部署机制。

在实施时,方案会建立集中配置管理中心,对配置之间的依赖关系、加载顺序等进行严格管理,保证具体的节点可找到正确的配置;然后结合自动的节点扫描、监控以及远程安装等工具,进行应用和服务的自动化快速部署,以大幅缩短部署周期、降低部署难度,并最终实现服务的全生命周期管理(部署、测试、上线、下线以及日常的启停、监控等)。

3、基于策略的系统弹性延展和服务故障处理

方案使用基于策略的事件处理框架,来实现系统资源与服务的动态调配,并支持系统上层的多样化应用以及系统自身的扩充延展需求。在这个过程中,策略引擎将对输入事件与策略进行匹配,并衡量策略定义系列中的规则表达式,生成一个符合应用或用户需求的执行项目(一个通知或者一个操作)。

这样,在提供一个灵活的策略定义框架的基础上,我们既可以实现资源和服务分配调度机制,来满足不同应用,又可以抽取系统管理工作中的共性任务,通过告警来迅速发现并分析问题,以应用的自动迁移来确保故障的及时恢复,并借助应用能力的扩展来确保服务性能,即以自动化的方式对业务进行持续性的保障。

使用产品