通信公司网管支撑系统日常维护及故障管理规定.doc
下载文档
上传人:职z****i
编号:1102521
2024-09-07
13页
261.29KB
1、通信公司网管支撑系统日常维护及故障管理规定编 制: 审 核: 批 准: 版 本 号: ESZAQDGF001 编 制: 审 核: 批 准: 版 本 号: 目 录第一章概述1第二章 维护组织2第一节 维护组织机构及职责2第二节 网管支撑系统与其他网络、系统维护界面的划分3第三章 系统的日常维护和管理5第四章 故障管理7第五章 质量管理9附录1 总部网管支撑系统故障处理流程10附录2 省公司网管支撑系统故障处理流程11第一章 概述第一条 网管支撑系统是为通信网络的运行维护及管理提供支撑的系统,它为实现集中维护、集中管理、集中监控提供系统平台,满足各业务层面不同的网管应用需求。第二条 为了规范网管支2、撑系统的维护管理,合理、可靠、安全、高效地组织、管理网管支撑系统,提高网管支撑系统的服务质量,确保网管支撑系统各类设备的正常运行,保障网管系统数据质量和网元同步接入,提高维护队伍整体素质和水平,特制定本管理规定,作为维护、管理网管支撑系统的依据。第三条 本管理规定适用于网管支撑系统及其相关配套设备等。目前网管支撑系统包括:网管系统、OMC系统、网管网络系统等。网管系统是由总部统一部署建设或由省内根据需要自行建设的支撑系统,包括专业网管、安全管理、信令监测、自动拨测、电子运维、综合网管等系统。OMC系统是设备厂家为管理网元设备所提供的支撑系统。网管网络系统是指网管支撑系统的承载网络以及相关设备。3、第四条 本管理规定按照网络运行维护规程框架编制,未详尽描述部分参照网络运行维护规程执行。第五条 各级维护管理部门应认真执行本管理规定。各省公司在本规定的基础上,结合当地的实际情况,编制实施细则,以确保网管支撑系统安全、可靠、高效地运行。第六条 本管理规定的解释权和修改权属于通信有限公司网络部。第二章 维护组织第一节 维护组织机构及职责第七条 网管支撑系统的维护管理采用统一领导、分级管理、分级负责的管理原则。在总部统一领导下,总部及各省公司负责各自管辖范围内网管支撑系统的维护管理工作。 第八条 总部网络部主要职责为: 1. 负责组织制定网管支撑系统的维护管理规定,监督各省落实维护规定,对各省的维4、护工作给予指导。2. 负责制定网管支撑系统质量考核指标和考核办法,检查和分析网管支撑系统的运行质量,组织考核评比。3. 负责网管支撑系统重大故障和重大安全事件的管理。4. 负责为网管支撑系统的设备维护、优化和故障处理提供技术支援。5. 负责724小时监控总部网管支撑系统的运行状况,负责总部网管支撑系统的日常维护、故障处理、资源调度、软件装载等工作,确保系统正常运行。6. 负责定期分析总部网管支撑系统的运行状况,做好系统预警工作,制定并实施相应的改造、优化措施。7. 负责总部网管支撑系统的安全工作,组织制定总部网管支撑系统的应急保障方案并定期演练。8. 对总部网管支撑系统的设备、软件版本进行管理5、。9. 负责牵头组织全国网管支撑系统维护人员的技术、业务交流与培训。 第九条 各省公司网络维护部门主要职责为:1. 贯彻总部网管支撑系统的维护管理规定,根据本省情况制定切实可行的维护管理实施细则。2. 负责落实总部网管支撑系统运行质量考核指标和考核办法,建立省内网管支撑系统的质量分析制度和质量监督体系。3. 负责724小时监控省内网管支撑系统的运行状况,负责省内网管支撑系统的日常维护、故障处理、资源调度、软件装载等工作,以及总部网管支撑系统在省内站点设备的日常维护和故障处理等工作。重大故障和严重故障需向总部网络部报告,并组织解决省内网管支撑系统运行维护中的问题。4. 负责制定省内网管支撑系统的6、网络结构、路由原则和省内网管支撑系统的网络实施方案。5. 负责定期分析省内网管支撑系统的运行状况,做好系统预警工作,制定并实施相应的改造、优化措施。6. 负责省内网管支撑系统的安全工作,组织制定省内网管支撑系统的应急保障方案并定期演练。7. 负责省内网管支撑系统至总部网管支撑系统互联的网络及设备的维护工作,确保部省接口的省公司侧正常运行。8. 对省内网管支撑系统的设备、软件版本进行归口管理。9. 负责牵头组织省内网管支撑系统维护人员的技术、业务交流与培训。第十条 各地市公司网络维护部门主要职责为:1. 贯彻落实总部及省公司制定的网管支撑系统维护管理规定和实施细则。2. 负责承担属地设备的现场维7、护职责。3. 配合省公司进行网管支撑系统的维护作业、故障处理、软件装载、工程割接等工作中需现场完成部分,按照省公司要求进行网管支撑系统的测试工作。4. 配合省公司进行应急通信保障预案演练与实施。5. 协助省公司分析省内网管支撑系统的系统运行状况,配合实施相应的改造、优化措施。6. 完成省公司委派的其它各项任务。第二节 网管支撑系统与其他网络、系统维护界面的划分第十一条 与所管辖网元的维护分工界面网管支撑系统与所管辖网元的维护分工界面是网管支撑系统连接所管辖网元的网管采集机,网管采集机设备及内侧归属网管支撑系统,网络和系统的网管接口归属管辖网元。第十二条 与承载网管支撑系统的IP承载网、CMNe8、t的维护分工界面网管支撑系统与IP承载网、CMNet的维护分工界面是网管支撑系统设备到IP承载网、CMNet配线架第一个端子,端子内侧设备归属网管支撑系统,端子外侧设备归属IP承载网、CMNet。第十三条 与承载网管支撑系统的传送网的维护分工界面网管支撑系统与传送网的维护分工界面是网管支撑系统设备到传送网DDF架第一个端子,端子内侧设备归属网管支撑系统,端子外侧设备归属传送网。第十四条 与动力环境系统的维护分工界面网管支撑系统和动力环境系统之间以网管支撑系统连接至列头柜的第一个接线端子为界,该接线端子往网管支撑系统设备侧归属网管支撑系统,该接线端子往电源侧的设备及线缆归属动力环境系统。第三章 9、系统的日常维护和管理第十五条 网管支撑系统维护工作主要指网管支撑系统软硬件的维护,包括系统本身及相关连接设备的定期检测、数据备份、故障处理等。第十六条 网管支撑系统必须实施定期备份制度。如果网管支撑系统需要升级变动,则在变动之前必须进行系统的全备份,包括:系统软件、应用软件及应用数据。系统全备份工作尽量保证在不影响生产的情况下进行。备份的介质必须保存在安全的环境中,避免被人为破坏,失去备份作用。第十七条 网管支撑系统的维护管理部门需要制定并实施系统和数据库安全访问策略,包括登录访问、网络权限、目录安全、属性安全、网络服务器安全、端口和节点安全及防火墙安全控制策略,并认真分析系统运行日志,及时发10、现系统隐患。第十八条 对于省内自建网管支撑系统,省公司负责组织编制日常维护作业计划并组织实施和定期检查。第十九条 网管支撑系统日常维护测试项目和测试周期参考下表。测试项目可根据各省系统的实际情况自行补充,测试周期可根据各省实际情况调整,测试频度不低于下表所列项目周期。序号类别项 目周期备 注1系统运行系统服务器CPU使用状况周系统服务器包括数据库服务器、应用服务器等其他SERVER类型的硬件设备。2系统服务器内存使用状况周3系统服务器硬盘空间状况周包括普通硬盘和磁盘阵列4数据库存储空间检查周查看数据库各存储空间的使用情况5系统重要进程运行状况日包括系统进程和应用进程6系统备份系统文件全备份不定11、期配置文件变化时进行。如果定期执行,则周期不能超过月。7数据库全备份月8数据库增量备份或归档日志备份日如果执行了每天做数据库全备份,则该作业可取消。9主要网络设备配置备份不定期配置文件变化时进行。如果定期执行,则周期不能超过月。10主要网管应用软件备份不定期软件版本变化时进行。如果定期执行,则周期不能超过月。11日常维护网管网络连接情况检查日包括网管系统内部网络连接,网管至网元的连接,网管与其它系统的连通性情况。12网管数据完整性、准确性、及时性核查日13系统日志检查周14删除旧的临时文件周15机房设备巡检和系统部件运行状态检查周16磁带机磁头清洗和相关设备清洁季度17NTP服务器运行状态检查12、及服务器主机系统时钟校准季度校准有时钟误差的主机时间。可采用NTP方式或者其他方式同步。18网管支撑系统应急方案演练半年19系统安全网管防火墙策略的检查季度根据总部安全基本要求设置网管防火墙策略。20系统账户安全管理季度对非法帐户和过期账号立即停止,及时清理无用账号。21修改服务器系统账号口令季度定期修改操作系统、数据库超级管理员权限级的账号的口令。22检查系统服务端口开放状态季度关闭与业务无关的服务端口,减少系统的安全隐患。23WINDOWS补丁发布情况检查和安全补丁加载月24防病毒软件的病毒库更新周25检查系统病毒情况周第四章 故障管理第二十条 故障处理中的职责划分:1. 总部负责网管支撑13、系统重大故障的管理,协调各省疑难故障的处理,通报重大故障和全网性设备硬件或软件版本缺陷问题。负责处理属于总部管辖的网管支撑系统故障。2. 省公司网络维护部门负责处理省内网管支撑系统和总部网管支撑系统省内站点的故障,必要时可商总部网络部和其它省公司进行配合,对于重大故障、严重故障和全网性设备硬件或软件版本缺陷问题须向总部网络部上报。第二十一条 故障分类:1. 业务故障:由于网管支撑系统硬件设备不能正常运行、应用软件错误、系统接口故障、人为差错等原因,造成网管支撑系统相关功能无法正常使用。2. 设备故障:网管支撑系统的主备用设备由于各种原因不能正常运行,对业务正常的运行造成隐患,但尚未影响相关功能14、的正常使用。3. 在业务故障和设备故障同时出现的情况下,定义为业务故障。第二十二条 故障级别分为重大故障、严重故障和一般故障三级。第二十三条 重大故障:1. 以下情况发生任意一种即为重大故障:(1) 网管系统完全瘫痪,导致系统所有功能均不可用,或所管辖系统的网管信息完全不可用的时长超过4小时; (2) 网管系统部省接口故障,导致系统不能进行接口信息传递,超过12小时;(3) 总部网管与省网管之间的网络中断4小时以上;(4) 网管网主备用核心交换机、主备用核心路由器全部中止通信4小时以上。2. 上报要求:重大故障一经确认,应立即上报,重大故障自障碍发生至上报到总部不得超过60分钟。3. 故障通报15、:总部和省公司在发现重大故障后,应将重大故障通报网管支撑系统相关使用部门。第二十四条 严重故障:1. 以下情况发生任意一种即为严重故障:(1) 网管系统完全瘫痪,导致系统所有功能均不可用,或所管辖系统的网管信息完全不可用的时长不超过4小时; (2) 网管系统部省接口故障,导致系统不能进行接口信息传递,不超过12小时;(3) 总部网管与省网管之间的网络中断4小时以内;(4) 网管网主备用核心交换机、主备用核心路由器全部中止通信4小时以内。2. 除上述情况外,省公司可以根据实际情况对严重故障定义进行补充。3. 上报要求:严重故障一经确认,应立即上报,严重故障自障碍发生至上报到总部不得超过60分钟。16、4. 故障通报:总部和省公司在发现严重故障后,应将严重故障通报网管支撑系统相关使用部门。第二十五条 一般故障:定义:除重大故障和严重故障外的其他故障为一般故障。第二十六条 故障处理流程见附录。第五章 质量管理第二十七条 为完善对网管支撑系统各个环节的质量控制,应建立各级检查体系。做到统一领导,分级管理,分工负责,层层到位,把好质量关。第二十八条 总部网络部负责组织建立网管支撑系统的质量分析制度,负责组织建立网管支撑系统质量考核体系,负责定期汇总、分析总部网管支撑系统的运行质量,监督并指导各省网管支撑系统质量分析工作。各省公司负责汇总整理省内网管支撑系统的运行质量、系统性能等指标,进行质量分析,并将运行质量情况上报总部网络部。第二十九条 各省公司要加强网管数据质量维护,为生产分析提供有力支撑。各省公司必须按照总部网络部有关网管数据质量的具体要求,保障本省的网管数据及时性、完整性、准确性,保障部省接口上报的数据与各省网管数据的一致性。第三十条 网管支撑系统主要性能指标:1、 部省接口数据完整性2、 生产分析数据、考核指标、告警数据的完整性3、 生产分析数据、考核指标、告警数据的准确率4、 生产分析数据、考核指标、告警数据的及时性5、 网元接入网管的及时率6、 网管系统可用性附录1 总部网管支撑系统故障处理流程附录2 省公司网管支撑系统故障处理流程