2018电力公司数据标准化推动自动化运维持续稳健发展研究报告(22页).pdf
下载文档
上传人:偷****
编号:501471
2022-07-29
22页
3.09MB
1、时间:2018/12/21 数据标准化推动自动化运维持续稳健发展 目录 对自动化运维的理解 自动化实践问题分析 交流总结与工作展望 02 01 03 04 数据标准化解决思路 对自动化运维的理解 资源 技术 流程 人员 通常对自动化的理解 我们通过一些实践,现在的理解是:IT运维工作,不断呈现场景化、碎片化、工具化的特征,自动化运维应该是覆盖资源、技术、流程、人员的运维全自动化。这涵括了早期的对脚本控制的理解。指对远程脚本的编辑、编排、自动执行、审计等。1-管理角度 更好的满足公司在技术、业务等方面 更安全、实用、高效的要求。2-成本角度 降低了一些流程维护执行、运维人员成本这两块的投入成本。2、自动化实施后带来的优势:自动化实施后带来的风险:目前控制类工具有一定风险,缺乏人员监护或者回滚机制,需要谨慎使用。建议优先使用自动巡检这样的监视类的工具。自动化运维的四个发展阶段 监视类工具远程掌控管理对象的运行状态 控制类工具对管理对象进行一定的远程操控 阶段1-纯工具阶段 人员驱动-人依然是占主导作用 管理人员审批流程,指定操作人员并进行工具授权 操作人员操作/监督自动化运维工具处置相关事件 处置完毕后,文案归档,用于生成月度季度报告 阶段2-半自动化阶段 数据驱动-数据是核心驱动力 工具在既定逻辑下,按部就班完成任务操作 数据自动流转,推动流程执行 人仅负责流程设计、监督、审核、回滚等环3、节 阶段3-全自动化阶段 通过机器学习与训练,使AI可以掌握一定的运维知识与技能,从而能够处理特定场景下的特定问题。海量的运维数据是智能化运维的前提 阶段4-智能化阶段 触发 流程 事件/需求 人员 授权 主管 审批 操作 预案 分配 工具 资料 归档 处置 事件 运行方式报告 全程数据采集 场景 流程 人员 工具 文档 数据 半/全自动化下的通用业务模式 半自动化模式下,以下节点均需要人工设计、参与,人为核心,部分环节自动化;全自动化模式下,各节点环节是以数据为核心,数据的底层流动直接驱动了业务的流转。调度场景下的数据驱动全自动化示例 2 3 4 5 6 1 预估本故障可 能的影响范围 协助4、故障检修 故障定位工具 抢修 事故分析报告 调度挂牌工具 监控气泡图颜色变红 气泡图变绿,业务拓扑恢复 班长电话确 认风险消除 调度撤牌工具 超级日志工具 7 调控班长分析故 障出现原因 应急预案工具 电话通知,屏 蔽故障源告警 影响分析工具 调度班-班长的愿望 主要工作:调度管理、系统监控、应急处置 工作场景:某信息系统故障后,会产生大量的告警信息,某班长需要进行快速判断及处置。通过一系列定制工具,他将迅速有效的完成工作。实际操作 新增工具 图例:业务拓扑图工具显示异常 5s 1m 1m 1m 30m 1m 2m 总时间40min 调度场景 时间价值、效率价值、服务价值 目录 对自动化运维的5、理解 自动化实践问题分析 交流总结与工作展望 02 01 03 04 数据标准化解决思路 建设与执行角度的风险 自动化 产品A 自动化 产品B 自动化 产品C 厂商A 厂商B 厂商C 产品A 产品B 产品C 重复建设风险:相关自动化工具的建设边界较难把控,各厂商工具部分功能重叠,可能会导致重复建设。潜在管理风险:工具执行人员的选择与工具授权,在实操层面会增加一定的流程管理成本。执行层面风险:同时在可选择工具较多的情况下,执行专责可能会存在一定的重复操作与应用情况。调控与运检角度的问题 自动化运维工具的上线,使部分调控专责的工作效率有了一定的提升,如故障定位工具,但是调控类自动化工具存在一定的重6、复采集、重复存储问题;在运检,远程操控领域,见效相对较慢,一是相关工具需要人员掌握一定的专业技能;二是电网企业的性质决定了在效率与稳定之间,更讲求稳定。在风险回退机制尚未建立的背景下,运检类自动化工具的执行,还需要人员的全程监督与协助。65%35%调控领域 包括信息通信系统的集中监视、调度指挥等工作 运检领域 包括所辖业务系统、机房基础设施等运行检修维护工作 工具联动角度的问题 在不同的场景下,各自动化工具存在明显的孤岛效应。场景开始 工具A 工具B 工具N 场景结束 调度抢修 故障定位工具、影响范围工具、应急预案工具、挂牌工具、运维事件全过程管理工具、超级日志中心 运维检修 影响范围工具、挂7、牌工具、配置管理工具、RFID辅助资产管理、运维远程监护工具、一键启停工具 运维巡视 自动化巡视工具、智能指标分析与分享工具、智能检修工具 资源规划 资源规划全过程管理工具、采集辅助工具 全寿命管理 业务系统全生命周期管理工具 风险评估 风险评估工具 业务培训 故障仿真工具、应急预案工具 应用场景 可选用工具 调度监控 业务拓扑图工具(目前调度适用网络拓扑、业务系统应用状态)、链路监控工具、挂牌工具 问题小结 自动化运维工具建设与应用,已经逐步开始见到成效,但是仍然面临着重复采集与存储,重复建设与应用,工具数据与应用孤立的问题。这是自动化运维发展到纯工具阶段与半自动化阶段,必然面临的困扰。自动8、化运维工具的应用场景是琐碎而繁多的,目前没有一家企业能够设计开发出所有的与特定行业业务紧密结合的自动化运维工具全集。因此我们认为,既能够解决上述问题,能够支撑百家争鸣、百花齐放,并且可以推动自动化运维迈向第三阶、第四阶的重要措施之一,就是数据及其标准化。目录 对自动化运维的理解 自动化实践问题分析 交流总结与工作展望 02 01 03 04 数据标准化解决思路 自动化运维数据标准化意义 迭代的是版本 操作的是人员 使用的是技术 面向的是场景 规范的是流程 数据是贯穿于标准化、自动化、智能化这样IT运维不同发展阶段的不变的要素之一。标准化的数据,可以减少自动化运维工具数据生产流通的汇总、清洗、治9、理成本,驱动业务流转。可以为大数据挖掘与智能化运维的机器学习、深度学习打下良好基础。未来世界,数据是生产要素,对数据的掌控力,就是生产能力。管控的是资源 实时流通、永久沉淀的 是数据 运维类的软件系统,包括自动化运维工具:自动化运维元数据内容 场景数据场景数据 人员数据人员数据 流程数据流程数据 技术数据技术数据 资源数据资源数据 自动化运维元数据要素 中文名称 英文名称 数据定义 数据类型 数据注解 数据值域 数据权限 场景ID SceneID 场景管理的唯一编码 字符 AA01 必选项M,最大出现1次“公开级”与“限制级”自动化运维元数据编码分类规则 自动化运维元数据内容 1-场景元数据/10、2-人员元数据/3-技术元数据 大类编码 大类名称 子类名称 细分类名称 A 场景元数据 场景基础子类 场景基础细分类 场景操作子类 场景操作细分类 B 人员元数据 人员管理子类 基础信息细分类 绩效考核细分类 培训细分类 运维及管控细分类 人员行为子类 运维行为细分类 人员能力子类 技能水平细分类 知识储备细分类 C 技术元数据 告警处理子类 处理信息细分类 运维工具子类 工具基础信息细分类 工具技术信息细分类 大类编码 大类名称 子类名称 细分类名称 D 流程元数据 检修管理流程子类 基础信息细分类 申报人信息细分类 处理信息细分类 抢修管理流程子类 基础信息细分类 申报人信息细分类 处理11、信息细分类 巡视管理流程子类 基础信息细分类 申报人信息细分类 处理信息细分类 资源申请流程子类 基础信息细分类 申报人信息细分类 处理信息细分类 配置变更管理流程子类 基础信息细分类 维护信息细分类 厂商硬件信息细分类 厂商软件信息细分类 服务商信息细分类 调度值班流程子类 基础信息细分类 申报人信息细分类 处理信息细分类 缺陷管理流程子类 基础信息细分类 申报人信息细分类 处理信息细分类 4-流程元数据 自动化运维元数据内容 大类编码 大类名称 子类名称 细分类名称 E 资源元数据 基础环境资源子类 机房基础设施配置细分类 机房基础设施性能细分类 硬件资源子类 主机配置细分类 主机性能细分12、类 网络配置细分类 网络性能细分类 存储配置细分类 存储性能细分类 通用软件资源子类 数据库配置细分类 数据库性能细分类 中间件配置细分类 中间件性能细分类 应用资源子类 应用资源基础信息细分类 应用Web事务细分类 数据库调用细分类 外部调用细分类 基础资源使用细分类 慢事务细分类 错误信息细分类 云资源子类 虚拟化配置元数据 虚拟化性能细分类 云平台配置细分类 云平台性能细分类 5-资源元数据 自动化运维元数据内容 自动化运维元数据角色 1、梳理清楚可以对外提供的元数据;2、给出获取相关元数据的接口方式。注册 管理者提供注册服务与目录服务。管理者 生产者 申请 消费者向管理者,查询了解本次13、使用的元数据是否已有工具提供。目录服务 消费者 申请 元数据生产者向管理者发起注册申请,申请内容包括数据生产者厂商信息、数据接口的技术选型。1、获取基础的元数据;2、根据业务场景及理解,对基础元数据进行二次加工,生成复合元数据。提供服务 如有,则直接可以获取到数据传递接口。自动化运维标准化工程实践 发布 上线 测试调试 研发生产 工具架构设计(数据架构)需求调研及可行性研究 1、自动化运维元数据内容、角色的标准化,应覆盖自动化运维工具工程实践的每一个环节。2、新建自动化运维工具应满足上述要求,历史自动化运维工具,按上述要求逐步改造。目录 对自动化运维的理解 自动化实践问题分析 交流总结与工作展望 02 01 03 04 数据标准化解决思路 总结 沟通 小结 国网蒙东信通公司,基于自己的实践探索经验,提出自动化运维四阶段概念,并指出现阶段的自动化运维发展中的问题,从数据标准化角度给出解决方案。工作 展望 我们后续将积极配合全国信标委大数据标准化工作组开展相关工作。当前我们参与/主导起草的标准草案包括信息技术-服务大数据-运维服务元数据、信息技术-服务大数据-自动化运维参考技术架构等,期待更多同行加入服务大数据专题组,为推动行业发展贡献自己的力量。THANKS!THANKS!