IT运维
运维自动化管理产品

一、产品简介

运维自动化管理产品将分散的运维日常操作及作业执行过程统一到标准的平台里,提高日常运维作业的执行效率、降低人工操作的风险和日常运维成本。

产品基础平台与访问控制层提供包括脚本管理、流程编排、作业执行等功能。提供包括作业脚本管理,支持多种脚本及程序扩展作业类型;可视化流程编排设计,图形化作业编排配置;统一作业执行管理,灵活的人工干预方式,多种任务调度能力;全方位的作业监控与控制能力及执行审计,实时统计作业执行等基础自动化调度、执行、控制能力。

产品基于基础平台与访问控制层能力,实现包括基础资源、应用系统、业务作业层面应用场景自动化,覆盖日常运维管理工作。具体覆盖场景包括:软件安装应用发布部署、业务作业调度、安全配置管理、虚拟化/云资源管理、自动巡检、故障自动处置、灾备管理等。

二、产品特点

1、开源可控

  • 基于主流开源框架设计开发。
  • 支持Agent及无Agent模式的执行作业,满足各类运维管理要求。
  • 2、架构灵活

  • 支持“原子化定义,插件式组装”
  • 模块化设计,提供标准Restful风格接口与其他系统对接。
  • 数据储存支持MySQL、SQLServer、Oracle等主流数据库。
  • 3、操作便捷

  • 提供可视化作业编排设计工具,以便更直观的配置与查看作业流程。
  • 提供多种灵活的作业干预方式,方便日常运维操作。
  • 4、开箱即用

  • 内置包括巡检、安装部署、应用启停等大量运维脚本与运维场景。
  • 提供默认报表与统计视图。
  • 三、产品功能

    1、自动化基础平台:脚本管理、流程编排、作业任务管理、凭证管理、Agent管理

    2、自动巡检:巡检指标、巡检计划、巡检报告

    3、部署发布:标准软件安装、应用一键发布、软件包管理

    4、故障处置:服务启停、灾备切换、数据清理

    5、主机安全:账号管理、合规检查、配置文件管理

    6、系统管理:组织机构人员管理、权限管理、操作日志审计

    四、产品架构

    五、客户案例

    某金融机构:运维自动化平台的软件开发和实施,主要实现:

    1、应用节点日志、模拟业务交易收发管理及重点业务交易的统一监控。

    2、多种自动化运维场景,包括一键切换、一键启停、文件比对、自动巡检等。

    3、通过作业批处理任务调度与编排,实现日常业务作业批量执行与过程跟踪。

    4、通过与其他外围系统的对接,实现告警及重要信息自动关联。

    5、通过多维度统计分析数据及报表,提供运维分析决策支持。

    六、实施能力

    1、产品实施技术

  • 图形化流程编排工具:图形化可拖拽的业编排流程设计,支持串行、并行、子流程设计;
  • 统一代理(Agent)技术:基于java语言开发的统一代理(Agent),提供统一代理实现统一数据采集、任务下发、文件传输;
  • 分布式自动化任务调度引擎:基于Redis等技术的分布式任务调度引擎,实现任务的下发、上报,支持脚本任务、批处理任务、Agent任务、文件传输、第三方服务任务调度执行;
  • 快速文件比对技术:通过MD5校验方式,实现AIX、Linux、Windows等操作系统,多系统、多目录的快速文件差异比对文件对比;
  • 故障自愈与修复技术:基于运维知识库及策略规则,实现IT系统故障的自动检测与自动修复。
  • 2、产品应用场景

    1)面向业务系统的故障自愈

    针对中间件积压等典型故障场景,固化故障处理流程,自动监测故障节点,通过分析判断实现故障自愈。步骤如下:

  • 通过配置提取,自动获取中间件上下级关系;
  • 检测到中间件请求积压后,同时检测上下级中间件的请求积压情况;
  • 基于最上级积压中间件的主机CPU和内存的利用情况,提供内存清理、服务器虚拟资源自动扩容操作;
  • 清理或扩容操作完成后,自动再次发起检测,直到积压恢复;
  • 通过对中间件积压故障自愈场景的实现,故障恢复时间缩短1半以上。
  • 2)基于DevOps的应用发布部署

  • 发布流程
  • 支持对接流程系统中的变更发布流程,提供待更新IT资源审批,跟踪资源状态变化,变更配置项信息来源于待审批的变更,审批通过后更新配置库,调用自动化发布流程。

  • 资源获取
  • 通过持续集成平台Jekins获取最新发布的资源包,根据策略按资源发布的环境自动更新相关配置文件,通过自动化工具将资源包下发到不同的系统运行环境中。

  • 服务启停
  • 根据业务系统对相关中间件(Tomcat、Weblogic)、数据库(MySQL、Redis)等服务进行一键启停。

  • 数据备份
  • 根据备份策略自动备份应用配置及数据,升级中出现异常,实现自动恢复。

  • 应用升级
  • 根据策略自动升级应用补丁,根据应用环境自动更新配置文件(如:ip地址、端口)。

  • 数据升级
  • 根据策略自动执行数据升级脚本。,包括业务运行情况、系统性能、数据接口、帐号权限等。

  • 升级结果验证
  • 对业务对象进行自动化健康度验证,包括业务运行情况、系统性能、数据接口、帐号权限等。