通信公司飞信系统维护故障处理管理规定.doc
下载文档
上传人:职z****i
编号:1132394
2024-09-08
10页
126.59KB
1、通信公司飞信系统维护故障处理管理规定编 制: 审 核: 批 准: 版 本 号: ESZAQDGF001 编 制: 审 核: 批 准: 版 本 号: 目 录第一章 概述3第二章 维护组织4第一节 维护组织机构及职责4第二节 飞信系统与其它通信网间的责任划分5第三章 系统的日常维护和管理6第四章 故障处理7第五章 质量管理9附录一 故障处理流程10第一章 概述第一条 飞信系统是向用户提供的综合实时、非实时、准实时等多种通信方式的综合通信服务系统。飞信平台业务平台通过CMNET网络和各省WAP网关、北京短信网关互联,通过E1专线与北京GMSC连接,通过飞信互通网关与其他运营商或互联网即时消息系统互联2、,并通过专线和一级BOSS系统互联。飞信系统提供WAP网关的HTTP代理接入方式、CMNET方式为终端用户服务,也允许PC用户通过Internet访问飞信系统的相应服务。第二条 为了规范飞信系统的维护管理,合理、可靠、安全、高效地组织、管理飞信系统,提高飞信系统的通信服务质量,提高维护队伍整体素质和水平,特制定本管理规定,作为组织、管理飞信系统的依据。第三条 飞信系统一点接入,服务全网,全网目前只有一套系统,设置在北京。第四条 本管理规定适用于飞信系统及其相关配套设备。第五条 本管理规定按照网络运行维护规程框架编制,未详尽描述部分参照网络运行维护规程执行。第六条 各省网络维护部门应认真执行本管3、理规定。在本规定的基础上,结合当地的实际情况,编制实施细则,以确保飞信系统安全、可靠、高效地运行。第七条 本管理规定的解释权和修改权属于通信有限公司网络部。第二章 维护组织第一节 维护组织机构及职责第八条 飞信系统的维护管理按照统一领导、分级管理、分级负责的原则,在总部统一领导下,总部及设备所在省公司负责各自管辖范围内飞信系统的维护管理工作。第九条 总部网络部职责:(1) 组织制定飞信系统的维护管理规定,监督各省公司对维护规定的落实情况,对各省的维护工作给予指导。(2) 负责制定飞信系统质量考核指标和考核办法,定期检查飞信系统的运行质量,组织考核评比。(3) 负责飞信系统重大故障和重大安全事件4、的管理。(4) 负责为飞信系统的设备维护、优化和故障处理提供技术支援。(5) 负责制定全网飞信系统网络组织、路由原则、局数据原则和全网业务的网络实施方案。(6) 负责飞信系统设备、软件、局数据、资源管理等工作。(7) 组织制定飞信系统的应急通信保障方案,并定期组织应急演练。(8) 定期协调设备所在省统计分析网络、设备运行情况,提出网络预警指导意见,制定网络优化调整策略,指导飞信系统的优化调整工作。(9) 对设备所在省公司的作业计划执行情况、故障处理及其他维护工作进行监督、考核。(10) 负责监视飞信系统的运行情况,并对设备所在省重大故障的处理进行督办。(11) 牵头组织各级维护人员的技术、业务5、交流与培训。第十条 设备所在省公司网络维护部门职责:(1) 贯彻总部各项飞信系统维护管理规定,根据实际情况制定切实可行的维护管理实施细则。(2) 负责落实总部飞信系统质量考核指标和考核办法,建立质量分析和质量监督制度,负责进行日常网络质量分析和测试。(3) 负责724小时实时监控飞信系统设备的运行状况,负责设备的日常维护、故障处理工作,在总部的要求下,具体进行资源调度、软件/补丁测试及装载、局数据制作等工作。(4) 按照重大故障管理要求及时向总部上报飞信系统的重大故障。(5) 按照总部制定的原则,具体进行飞信系统网络结构、路由组织等调整的实施工作。(6) 在总部的指导下,负责做好飞信系统的设备6、软件、局数据、资源管理等工作。(7) 按照总部的要求制定具体的飞信系统应急保障方案,并在总部的组织下进行定期应急演练。(8) 负责定期统计分析飞信系统的运行状况,分析飞信系统故障及处理情况,做好网络预警工作,定期将相关分析报告上报总部。(9) 根据飞信系统的运行情况,制定网络优化、调整的建议,并上报总部网络部审批,通过审批后,在总部的部署下具体实施。(10) 配合总部定期组织维护技术人员的交流和培训工作。第二节 飞信系统与其它通信网间的责任划分第十一条 飞信系统与CMNET网络的维护分工界面是飞信系统设备到CMNet网络交换机的接口,接口内侧设备归属飞信系统,接口外测设备归属CMNET网络。7、第十二条 由于飞信系统是通过CMNET与其他各网络、系统互连,所以与其它网络系统的维护分工界面同CMNET网络。这类网络包括:GPRS、短信网关。第十三条 飞信系统与计费系统的维护分工界面是飞信系统设备连接到计费系统的接口,接口内侧设备归属飞信系统,接口外侧设备归属计费系统。第十四条 飞信系统在增加节点、进行重大局数据修改或实施软件版本升级计划前,必须事先通报相关部门,必要时,需在相关部门的协助下完成上述工作。第十五条 飞信系统要积极配合完成与CMNET、短信网关等有关的网络调整工作,并配合进行相关测试。第三章 系统的日常维护和管理第十六条 飞信系统维护主要指设备网元和网络层面的维护,包括系统8、本身及相关连接设备的定期检测、数据备份、故障处理等。第十七条 设备所在省公司参照本规定中所规定的维护监测项目、周期和要求, 制定详细的作业计划,并组织实施和定期检查。第十八条 飞信系统日常维护测试项目和测试周期参考下表,测试项目可根据实际情况自行补充,测试周期可根据实际情况调整,但频度不低于下表所列。测试范围测试项目测试周期备注系统状态硬件系统检查日网络连通性检查实时监控系统软件检查日监测实时告警消息日飞信系统日志检查日系统资源飞信系统文件系统使用情况日飞信系统数据库、磁盘使用情况日飞信系统CPU、内存、IO使用情况日系统进程管理飞信系统应用软件主要进程状态检查日飞信系统数据库主要进程状态检查9、日系统安全管理防火墙连通性检查实时监控防火墙规则检查日防火墙路由检查日防火墙日志检查日定期修改设备密码季系统数据管理数据库备份日日志文件备份日系统数据核查季文件系统备份半年统计分析用户总数/新增/注销日MO/MT/PC消息/手机客户端消息/IVR成功率/失败率日现场看护机房电源、空调、温湿度检查日备品备件的清理核对季第四章 故障处理第十九条 故障处理中的职责划分:1 设备所在省公司网络维护部门负责飞信系统平台设备、网络及相关配套设备的故障处理,并配合其他省处理飞信系统相关故障,必要时可请总部网络部进行协调。2 非设备所在省负责处理本省飞信系统相关设备、网络的故障处理,并配合设备所在省进行相关故10、障处理。第二十条 故障分类:1 业务故障:由于飞信系统不能正常运行、局数据设置错误、互联互通故障、人为差错等各种原因,造成飞信系统相关业务质量下降甚至中断。2 设备故障:飞信系统的主备用设备由于各种原因不能正常运行,对业务正常的运行造成隐患,但尚未影响业务。3 在业务故障和设备故障同时出现的情况下,定义为业务故障。第二十一条 紧急故障1 定义:飞信系统出现某项或若干项业务中断,造成全网或部分省用户无法正常使用业务,称为紧急故障。2 上报要求:故障发现省必须在10分钟内上报总部网络部。3 故障通报:总部网络部在发现紧急故障或接到省公司报告后,应将紧急故障通报业务受影响的省。4 故障跟踪及处理:总11、部和省公司按照分工职责,协调相关资源,抢通业务。若业务在短期内无法恢复,故障升级为重大故障,应按照重大故障的要求上报和处理。第二十二条 故障级别分为重大故障、严重故障和一般故障三级。第二十三条 飞信系统重大故障:1、 以下情况发生任意一种即为重大故障:(1) 由于各种原因造成系统所承担的全部业务在凌晨1时至凌晨6时全部阻断,业务中断故障历时超过60分钟;在其他时间段,业务中断故障历时超过30分钟。(2) 飞信系统核心节点发生故障造成本节点不能承载业务,且设备故障历时超过60分钟。2、 上报要求:重大故障一经确认,应立即上报,重大故障自发生至上报到总部不得超过60分钟。3、 故障通报:若重大故障12、涉及省际、国际业务,总部网络部应通报业务受影响的省。第二十四条 飞信系统严重故障:1. 以下情况发生任意一种即为严重故障:(1) 由于各种原因造成系统的全部业务中断,在凌晨1时至凌晨6时,业务故障历时低于60分钟;在其他时间段,业务故障历时低于30分钟。(2) 飞信系统发生故障造成本节点不能承载业务,且设备故障历时不超过60分钟。(3) 由于各种原因造成某项或若干项业务中断。(4) 由于各种原因造成飞信业务质量下降,飞信关键性能指标低于正常水平30%,历时超过60分钟。(5) 飞信系统核心冗余设备发生故障不能正常运行,尚未影响业务,但是对业务正常运行造成严重隐患,且设备故障历时超过60分钟。213、. 除上述情况外,各省公司可根据实际情况对严重故障定义进行补充。第二十五条 飞信系统一般故障:1. 定义:除重大故障和严重故障外的其他故障为一般故障。2. 上报要求:飞信系统设备所在省自行处理,按照相关管理办法上报。第二十六条 故障处理流程见附录一。第五章 质量管理第二十七条 为完善对飞信系统各个环节的质量控制,应建立各级检查体系。第二十八条 总部网络部负责组织建立飞信系统的质量分析制度。1. 飞信平台设备所在省负责分析运行质量,排除质量隐患,不断提高网络运行质量和服务质量。2. 飞信平台所在省公司负责定期向总部汇报飞信平台运行质量、网络性能等指标。3. 飞信平台所在省公司负责定期向其他省通报飞信平台运行质量、网络性能等指标。第二十九条 飞信系统性能指标:(1) CPU、内存日平均和峰值负荷(2) 忙时PC客户端登陆次数(次/秒)(3) 忙时手机客户端登陆次数(次/秒)(4) 忙时短信上行处理数量(条/秒)(5) 忙时短信下发数量(条/秒)(6) 忙时PC消息处理数量(条/秒)(7) 忙时手机客户端消息处理数量(条/秒)第三十条 对各项运行维护指标的考核评定以运行维护考评体系的规定为准。附录一 故障处理流程