轨道交通大数据中心工程可行性研究报告73.doc
下载文档
上传人:Le****97
编号:962884
2024-08-20
72页
2.90MB
1、重庆轨道交通大数据中心工程可行性研究报告目 录1项目概述41.1项目名称41.2项目单位41.3建设背景41.4现状分析41.5项目必要性分析51.6项目可行性分析61.7社会经济效益分析71.8项目建设目标72企业构建大数据中心趋势83轨道交通行业构建大数据中心趋势104大数据中心价值分析115大数据中心总体设计方案125.1建设原则125.2建设范围135.3总体架构165.4应用框架175.5技术架构185.6物理架构196大数据中心分项设计方案206.1数据仓库设计206.2非结构化数据存储平台236.3数据采集平台设计246.3.1数据抽取246.3.2数据映射246.3.3数据转换2、256.3.4数据检查256.3.5数据加载256.3.6异常控制266.3.7作业管理266.4企业数据模型设计276.5数据分层存储276.5.1临时数据层(ODS层)286.5.2基础数据层286.5.3汇总数据层296.5.4应用数据层296.6数据治理296.6.1数据盘点296.6.2数据标准306.6.3数据质量管理316.6.4元数据管理317大数据中心分阶段建设规划327.1概述327.2数据接入规划337.3数据容量测算337.4建设范围规划347.5双中心规划建议358大数据中心第一阶段业务应用设计378.1统计分析378.1.1指标管理378.1.2CoMET指标4683、.1.3MOPES指标508.2专题分析548.2.1OD分析548.2.2线路、车站统一视图548.2.1客流预测568.2.1运力运量匹配分析568.2.2设备生命周期管理分析578.2.3物资供应链分析578.3第一阶段应用效果示意578.3.1运管人员驾驶舱578.3.2客流、OD专题分析588.3.3报表系统598.3.4灵活查询608.3.5车站统一视图618.3.6线路统一视图618.3.7手机APP提供公众信息629大数据中心第一阶段工程进度6210项目风险与风险管理6310.1风险识别和分析6310.2风险对策和管理6411大数据中心组织架构设计6512大数据中心第一阶段投资4、预算评估6713大数据中心第二阶段投资预算评估6814机房环境要求6914.1第一阶段机房环境要求6914.2第二阶段机房环境要求6914.2.1主中心6914.2.2备中心701 项目概述1.1 项目名称重庆轨道交通大数据中心工程1.2 项目单位重庆市轨道交通(集团)有限公司1.3 建设背景重庆轨道交通是服务于中国重庆直辖市的城市轨道交通系统,最早于2005年6月18日正式开通运营,是中国西部地区第一个城市轨道交通系统。截止2015年12月30日,重庆轨道交通运营线路有5条,包括1、2、3、6号线及国博线,线网覆盖主城九区,运营里程达到202公里,车站120座。2015年,重庆轨道交通年乘客5、量达到6.3亿人次,日均客运量180多万人次。重庆轨道交通在建线路5条主线(包括4、5、9、10号线及环线)及其它延伸线(如1号线璧山段),将于2020年前先后通车,届时运营里程将超过400公里,日客运量预计超过600万人次。线网规模的不断扩大及客流的不断增长将给重庆轨道交通在运营组织、协调管理、安全保障和指挥决策等方面带来新的挑战。在同样的飞速发展形势下,国内一些地铁公司已经开始探索基于数据仓库技术构建运营大数据中心进行客流、行车和设备的综合分析,实现其“让数据说话”的大数据战略目标,这在国内轨道交通行业内已经成为一种趋势。1.4 现状分析重庆轨道交通集团企业信息化工作经过多年努力,已经建设6、了以EAM、ACC等系统为代表的一系列生产、运营、办公信息化系统,初步实现了企业在生产、运营、管理等领域的的信息化、流程化、自动化支撑,但由于各个系统分散建设、没有统一规划、建设厂家众多,信息化整体上存在以下问题: 没有统一的企业数据标准,数据一致性、准确性存在较大问题。 生产、运营系统数据统计、数据分析功能弱,无法满足上级单位、集团运营、业务部门需求。 应用孤立、数据孤立,业务系统之间信息交互困难。 各系统之间数据无整合,无法形成跨域数据分析能力。 缺乏有效的数据存储、归档、管理手段,数据资产利用率低。1.5 项目必要性分析重庆轨道交通各信息系统单独建设,由于建设单位不同、信息数据标准不统一7、各系统间无法形成有效联动,从而导致各专业间无法及时沟通协调,这将给运营管理的整体效率带来负面影响、甚至影响应急事件的处置效率。另外,各专业系统信息数据分别存储,无法统一访问、分析,管理决策人员无法站在全企业高度对全路网数据进行综合统计分析及进行数据挖掘工作,从而难以利用数据价值对企业运营管理和路网规划发展进行辅助管理和决策。结合城市轨道交通建设投资大,建设周期长的特点,在依靠扩大线网规模提高城市轨道交通的覆盖率后。要再提高运营效率,还必须依靠“大数据”信息技术等信息一体化的“巧劲”实现城市轨道交通智能化,起到“四两拨千斤”的效果。目前,人类已进入大数据时代。在大数据时代,“数据”正在成为一种8、“资源”或“资产”,越来越多的企业、科研机构和政府,开始利用数据分析、数据挖掘来创造新的价值。依据数据进行运营管理,从数据中获取价值,让数据主导决策,是一种前所未有的运营管理决策方式,正在推动着人类信息管理准则的重新定位。重庆轨道交通构建企业级大数据中心有以下必要性: 从行业发展趋势来看,大数据中心是轨道交通企业信息化建设中不可或缺的重要一块。 借助大数据中心建设进行企业数据治理、构建企业数据标准、为未来企业信息化发展构建良好基础,对于重庆地铁来说非常迫切。 各专业业务分析需求的提升、跨部门综合分析需求的提升、科学决策需求的提升需要大数据中心进行支撑。 大数据中心的建设可以应对各专业数据有效整9、合、历史数据有效存储管理的需求。 将数据当成企业的一项重要资产进行管理,通过分析、挖掘等手段不断从数据中发掘有用价值,推动企业在运营、管理、资源开发、应急等方面的效率、效益提升。1.6 项目可行性分析重庆轨道交通经过多年发展,线网运营已成规模,运营管理已成体系,信息化建设逐渐成熟,人次储备日趋完善,综合分析,大数据中心建设具备以下可行性: 业务成熟度可行,具备构建企业大数据中心的条件。 理念可行,IT需求驱动、通过数据驱动业务运营成为企业自上而下的一种共识。 技术可行,信息化建设经验、人才储备具备了构建大数据中心的条件。 运维组织可行,信息化运维管理经验满足未来大数据中心的运维管理要求。 资金10、筹措可行。1.7 社会经济效益分析开展轨道交通行业大数据中心建设具有很的社会效益和经济效益,主要体现在:提升业务运营效率、提升资源开发效益、提升应急管控能力、提升科学决策能力、实现信息系统集约和资源共享、提升公众服务能力、补足业务分析数据分析短板。本项目建成后,可以形成以下经济效益、社会效益: 提升企业信息化水平,提高员工数据查询、数据分析效率; 提升线网运营、管控、应急处置效率; 降低轨道交通系统故障率; 降低采购、仓储、物流配送成本; 优化设备维修机制、降低维修成本; 提升资源开发、广告营销效益; 提升企业科学决策、战略决策能力; 降低能耗、节省电力成本; 提升公众信息服务能力,提升乘客满11、意度; 提升对交委、运管局、交开投等上级单位的数据服务能力,提升对轨道公安、消防、医疗等兄弟单位的数据共享能力。1.8 项目建设目标重庆轨道交通大数据中心项目的建设目标为:有效整合重庆轨道交通企业内外部数据,以数据仓库为核心构建企业级大数据分析平台,通过数据分析、数据挖掘、数据展现等技术手段为重庆轨道交通在运营管理、资源开发、规划建设、科学决策、应急辅助支撑、公众信息服务等方面提供高效有价值的数据服务,通过数据驱动的方式全面提升企业的运营管理效率、资源开发效益和安全保障能力,有效降低企业运营成本,不断提升综合服务水平,助力重庆轨道交通的长远发展。从大数据中心的长远建设发展来看,大数据中心不仅对12、内提供与决策、运营、安全管理相关的分析服务,还将为交委、运管局、交开投、公安、消防、公交等上级主管部门及外部协作单位提供必要的数据服务,另外还需为公众乘客提供公众信息服务。2 企业构建大数据中心趋势大数据中心是企业信息化应用建设发展的必然阶段,传统信息化建设侧重于对业务逻辑的模拟,应用系统主要任务是对业务过程的电子化和人机交互的支持,主要是对已知过程的辅助和支撑,大数据中心建设是以数据为核心的数据类应用系统,总体上是从数据层面对企业的全面模拟,大数据中心是企业“数字化”的核心基础,呈现如下总体趋势:1、统计型大数据中心向运营型大数据中心的演进是核心的发展方向。大数据中心的核心是数据分析,数据分13、析与在企业运营中的作用一直在不断提升,从最初的大数据中心1.0阶段以统计、事后描述为主,到大数据中心2.0阶段以数据价值发现、整合内外部数据为特征,再到大数据中心3.0阶段以整合广泛数据,实现运营级的业务协同为基本特点,呈现出数据应用与企业运营关系日益紧密,时效性不断增强的基本趋势。2、从内部数据采集到全面整合数据价值链的是大数据时代的关键转变。大数据中心建设的集成是数据,随着大数据技术和网络条件的发展,特别是数据生态环境的发展,企业大数据中心的建设在数据采集范围方面,呈现根据广泛的整合外部数据的趋势,社交网络的信息、供应商数据、监管机构的数据、合作单位的数据等等,都成为企业 大数据中心建设必14、须考虑的数据来源,这些不同来源的数据,共同构成企业数据价值链的组成部分,形成企业数据的价值发现基础。3、数据应用与业务过程的协同是大数据时代数据平台应用的重要特征数据分析功能的建设在信息化建设中已经存在了很长时间,传统的统计系统、报表系统是分析系统的原型,但传统系统主要是对数据的事后汇总和统计,不能实现事中和事后的统计分析,数据分析和业务过程相脱节,不能对业务处理过程提供支撑。在大数据时代,业务过程中的数据能够实现实时或准实时的采集和处理,分析技术也支持对数据进行实时的分析处理,从而达到业务级的响应和反馈,数据分析的价值将显著提升,数据与业务过程的协同是大数据时代数据平台应用的重要特征。4、大15、数据中心中心分析应用的复杂度快速提升大数据中心应用建设遵循一定的规律,简单上可分为报表阶段、数据分析、分析预测、运营辅助和主动支持五个阶段,不同的阶段大数据中心相关应用的特征和复杂度存在显著不同,随着大数据中心技术的不断发展,目前各类大数据中心应用的复杂度不断提升,报表分析成为必要基础功能,数据分析功能已经成为核心能力,预测和及时数据服务反馈成为大数据中心建设的重要内容,数据分析专家和数据产品日益清晰和重要,运营级的数据分析应用在领先行业开始初步呈现。5、从关键业务领域的数据集成向统一企业级大数据中心的演变大数据中心建设的基本原则是从数据层面实现企业业务的数据层面的模拟,为保证数据的整合统一,16、建设统一的大数据中心是必然的选择,电信、金融等大数据中心建设较早的行业经历了管理大数据中心和生产大数据中心分别发展,之后逐步整合的过程,经历了从有市场营销类数据整合到经营类数据整合应用,到综合管理类数据应用再到自动化监控数据整合的大致过程,通过整合的统一企业大数据中心平台,支持整个企业业务各个层级的数据分析需求,已经成为业界的共识。3 国内轨道交通行业构建大数据中心趋势1、北京地铁:系统名称为北京地铁路网指挥中心信息中心系统,已经于2012年建设和上线;服务于路网指挥中心、运营公司和交通委等部门;支持实时客流、行车和设备的综合统计分析,支持路网能力评估,支持应急事件决策支持等;系统访问支持手机17、大屏、电脑等多种接入方式;依托数据仓库技术及地铁行业逻辑模型实现了企业级数据整合,逐渐实现“数据驱动指挥和运营”的战略目标。2、广州地铁:系统名称为广州市轨道交通工程线网指挥平台数据中心系统,正在建实施过程中,服务于运营公司,支持行车类指标、服务设施类指标、客流类指标、能耗类指标的实时统计,依托依托数据仓库技术及地铁行业逻辑模型实现了地铁运营类数据的整合,目前系统建设中,预计2016年12月系统上线。3、深圳地铁:系统名称为深圳地铁NOCC项目数据中心系统,服务于运营公司和交通委等单位,应用参考北京地铁模式,于2015年上半年完成了系统招标,将依托数据仓库技术及地铁行业逻辑模型实现企业级数据18、整合,目前系统建设中,预计2017年6月系统上线。4、天津地铁:系统名称为天津地铁综合控制中心数据中心系统,应用参考北京地铁模式,服务于运营公司和交通委等公司,2015年8月完成招标,将依托数据仓库技术及地铁行业逻辑模型实现企业级数据整合,目前系统建设中,预计2017年6月系统上线。5、上海地铁:系统名称为上海轨道交通网络数据中心示范工程,正在规划中,系统将服务于申通地铁集团和运管中心,2015年底报上海市发改委已批准立项,预计2016年底之前完成招标,2017年9月系统上线。4 大数据中心价值分析基于成熟的数据仓库技术构建重庆轨道交通大数据中心,可为重庆轨道交通的网络化运营管理带来以下价值:19、1、实现重庆轨道交通企业级数据集中统一:整合PSCADA、FAS、BAS、SIG、ATC、AFC、ACC、EAM、财务、人力等系统数据,形成企业级数据统一视图。2、辅助运管人员及时了解路网情况、提升运营管理水平:自动化实现客流、设备、行车、票务、清分等指标的实时统计,辅助运管人员及时了解路网情况,并可基于OD数据进行清分模型优化和精准票务定价,科学指导运营。3、支撑重庆轨道交通企业中高层管理决策分析:基于整合的企业各专业、各部门、各系统数据,借助大数据中心强大的数据处理能力和数据分析能力,可按照不同层次需求构建企业内部管理专题分析模块,形成跨域综合分析能力,可为企业中高级管理人员提供成本效益、20、财务风险、采购投资、人员绩效、计划预算等方面的企业管理分析应用,以及面向企业战略层面的企业宏观能力分析应用。4、突发事件辅助决策支持:收集突发事件预案,形成应急预案知识库,增强全员安全培训和预演,在发生突发事件情况下提供决策支持。5、支持路网的规划指导:结合客流数据、居民居住数据、市政规划数据等,提供新线路规划的数据支持,同时可预知新增线路对路网的影响。6、提升设备维修管理水平:可以集成各线路、各站点各专业设备基础数据、使用数据、检修信息、故障数据、能耗数据,从而可以全面提升设备管理水平,而且可以以线路、站点视角统一了解各专业设备运行情况,降低设备故障率、减少设备停机时间。7、提升物资管理、物21、料采购管理效率:基于物资物料历史采购使用数据及当前物资物料采购库存数据进行综合分析,管理人员可以精确的掌控各类物资物料的库存情况、历史采购情况、需求周期情况,从而有针对性的制定更加合理采购计划、降低采购成本、降低库存成本,从而提升物资物料管理的整体效率。8、支撑节能降耗分析:通过节能降耗分析,进行行车计划优化调整,适当增加空闲时段发车间隔,降低运营成本;通过节能降耗分析,分站点、分站口、分时段进行设施开关自动设置,减少不必要的电力浪费,降低运营成本。9、支撑PPP模式投融资成本效益分析:提供基础设施建设成本数据、地铁运营成本数据、融资信贷成本数据、地铁运营收入数据、地铁商业经营收入数据等,进行22、新建线路建设运营成本效益综合评估预测分析,支撑PPP模式分析,为多种所有制资本参与地铁运营提供数据支撑。10、支撑地铁上盖资源开发:利用数据分析技术,结合轨道商圈的用户行为模型及商业环境特性,实现精准广告投放、商业选址及地产开发。11、提供轨道交通路况等公共服务:基于历史数据分析,提供客流预测、预警,合理引导客流,提升出行乘客的满意度,并为整个城市智能交通指挥提供决策依据。12、促进地铁企业数据标准化:借助于大数据中心的建设,促进全企业数据标准化、规范化,提升企业整体信息化管理水平。13、为上级主管部门、外部协作单位提供数据服务:基于大数据中心的数据整合能力和分析服务能力,可为交委、运管局、交23、开投等上级主管单位及轨道公安、轨道消防、公交等外部协作单位提供必须的数据服务。5 大数据中心总体设计方案5.1 建设原则重庆轨道交通大数据中心的建设应遵循“统筹规划,分步实施,先易后难”的总体原则,逐步形成完整的企业级数据分析支撑架构。在项目具体建设过程中,必须遵循如下原则:1.先进性原则:平台应采用先进、成熟、可靠的技术,遵循目前国际和国家的相关标准或规范,应具有优良的系统体系结构和先进合理的设备配置,确保整体系统的先进性。2.开放性原则:基于业界开放式标准,对系统中的各种网络协议、硬件接口、数据接口等进行统一规划,为未来的系统扩展奠定基础。3.前瞻性原则:系统必须具有充分的前瞻性,尽量考虑24、到未来3-5年的发展趋势。4.灵活性与可扩展性原则:能够根据应用需求,方便扩展设备容量和提升设备性能,具备技术升级、设备更新的灵活性,具备支持业务功能的扩展与重构的灵活性。5.完整性原则:平台应满足重庆轨道交通运营、管理、分析、决策的需求,同时平台应能与其它信息系统进行信息共享或提供数据接口。6.安全可靠性原则:平台应提供较强的管理机制和控制手段,提供系统备份、数据恢复、事故监控和网络安全保密等技术措施。7.实用性原则:平台应实现用户可接受的查询效率与响应时间,有良好的人机接口与灵活多样的展现方式。8.可靠性原则:应选用高可靠性的产品和技术,系统软件要具有较强的容错能力,使整个系统不易崩溃和受25、破坏,并具有良好的恢复能力。5.2 建设范围重庆轨道交通大数据中心将由一个基础数据平台、五大业务平台、三大管理平台构成,如下图所示: 基础数据平台基础数据平台是大数据中心的核心,定位于重庆轨道交通大数据中心的数据中枢,负责对全部数据进行整合管理,支持各类数据分析使用需求。基础数据平台包括数据仓库平台和非结构化数据存储平台。数据仓库平台需支持海量数据存储、支持复杂数据应用的计算、存储和数据处理,应具备卓越的性能,良好的扩展性,大并发处理能力。基础数据平台从逻辑上分为临时数据层、基础数据层、汇总数据层和应用数据层。 统计分析平台统计分析平台基于基础数据平台提供的数据,通过报表、指标查询、即席查询、26、多维分析、图形化展示等数据分析展现手段为访问用户提供灵活的数据分析访问能力。 运营评估平台运营评估平台主要是面向特定的专项业务分析需求,基于基础数据平台提供的数据,结合数学模型、挖掘算法等分析手段,形成专题分析应用,为用户提供深度数据分析结果与报告,如客流预测、票价测算分析、设备预测性检修等。 应急辅助决策平台应急辅助决策平台主要基于已有的各类与应急事件、应急资源相关的数据,支撑应急预案管理、应急资源管理、应急事件评估、应急预案优化等涉及地铁安全运营、应急事件处置相关的分析应用,并与应急调度、应急处置系统进行联动。 数据仿真平台数据仿真平台主要借助仿真软件,以地铁线站基础数据、客流数据、行车数27、据、设备数据、资源数据等数据为输入,建立相关仿真模型,模拟演练地铁运营中可能发生的各类事件的动态状况。 信息服务平台信息服务平台主要面向内外部用户(包括重庆地铁内部用户、重庆市交通委、运管局、交通开发投资集团、公安、消防、公交等部门)提供所需地铁运营分析数据,另外也负责对公众提供地铁综合信息查询、地铁生活圈信息、地铁线网运行实时信息等信息查询服务。 元数据管理平台元数据管理平台是大数据中心的知识中心,是大数据中心进行数据管理的基础平台,可以为应用开发、系统运行维护和业务用户对数据的使用提供帮助。 数据质量管理平台数据质量管理平台是支撑通过技术手段建立一套结合人员和流程的数据质量管理机制的技术平28、台。数据质量管理通过部署在元数据管理平台和 ETL工具上的一系列程序、脚本和检查规则,可以在数据流转的任何环节对数据进行质量检查,最大限度的保证数据的一致性、完整性、正确性。数据质量管理不仅仅是一套技术手段,关键是建立一套有效的数据质量治理流程,将数据质量问题的治理变成一个长效机制。 基础管理平台基础管理平台主要支撑大数据中心一系列基础管理功能,如:系统管理、日志管理、权限管理、安全管理、备份管理等。5.3 总体架构大数据中心的架构在设计上借鉴国际国内同行已有成功案例经验,并结合重庆地铁当前信息化现状及未来发展规划,遵循先进性、开放性、灵活性、可扩展性等原则,采用数据仓库分层设计理念,总体架构29、如下图所示:数据获取层:主要从EAM、ACC、BAS、FAS、财务、人事等生产、运营系统按照预定义好的接口标准获取相关业务生产数据。数据存储层:数据存储层以交通行业逻辑数据模型为参考构建重庆地铁标准数据模型,对采集的生产业务数据进行加工转换并按照主题域的方式进行整合存储,并根据业务分析需求进行汇总、计算,对上层应用提供相关数据服务。应用层:根据实际业务需求构建数据分析应用,以报表、指标查询、图形化展示、数据分发等方式提供个性化的数据服务。访问层:支持不同用户以多样化的形式进行数据查询和访问。管理服务:以元数据、数据质量管理为核心保证大数据中心数据标准一致、数据质量可靠,并针对大数据中心提供必要30、的安全管理、权限管理、日志管理等功能。5.4 应用框架大数据中心应用的建设依赖于业务需求和数据准备两方面因素,与平台建设一样也采用分阶段建设原则,总体应用架构如下图所示:总体应用框架从业务运营管理的角度分为企业管理分析、运营管理分析、作业管理分析三大类,根据业务需求又可细化为一个个具体的业务分析点,每个业务分析点将以分析应用的形式落地于大数据中心之上。依据分析需求的紧迫度及数据准备情况,分析应用可分阶段建设。如下图所示,通过构建针对性的分析型应用可以在提升运营安全、提升资产运营效率、降低运营成本、提升乘客出行满意度和提升资源开发效率等方面全面支撑重庆地铁智能化运营管理战略。5.5 技术架构大数31、据中心将采用典型的数据分析系统架构,即分层架构,包括源系统层、数据获取层、数据存储层、应用层和访问层,支持系统的可持续演进,具体的技术架构如图所示:5.6 物理架构大数据中心包括数据仓库一体机、非结构化存储服务器、存储阵列、光纤存储交换机、磁带库,以及相关配套应用服务器,包括接口服务器、数据管理服务器、ETL服务器、统计分析服务器、运营评估服务器、应急辅助决策服务器、GIS服务器、开发测试服务器、报表管理服务器、数据仿真服务器、WEB服务数据发布服务器、数据备份服务器等,以及必要的网络设备如:交换机、路由器、防火墙等,物理架构如下所示:6 大数据中心分项设计方案大数据中心的设计的核心内容包括数32、据仓库平台设计、非结构化数据存储平台设计、企业数据模型设计、数据分层存储设计、数据治理等方面内容。6.1 数据仓库设计数据仓库平台主要用于保存结构化数据、是大数据中心的核心,数据仓库的主流架构路线是Shared Nothing的MPP海量并行处理架构,其在线性扩展、投资保护、数据均匀分布、实时性能高等方面非常出众,是满足海量数据分析的最佳选择。为此,中国移动集团、中国工商银行以及国内同行企业如北京地铁、广州地铁、深圳地铁、天津地铁等具备海量数据分析特点的企业均采用具备MPP架构的平台构建企业的数据仓库平台。 线性扩展数据仓库平台需具备非常好的线性扩展能力,以满足支撑重庆轨道交通不断增长的数据存33、储及分析需求。 投资保护根据大数据中心项目的时间跨度周期长的特性,为了保障项目投资的持续有效,最大限度地保障重庆轨道交通的投资,因此数据仓库平台需支持在原有平台基础上进行持续扩容的能力。 数据均匀分布数据分布是否均匀直接影响到数据仓库平台的访问性能,为了优化数据仓库平台性能,数据分配应该是随机和均匀的分布,以便能以最简洁的路径访问到。数据分布倾斜一方面影响到数据仓库的查询性能,另一方面也带来硬盘访问的不均衡,因此带来磁盘损坏率高等问题。因此数据仓库平台应具备数据自动地、均匀地分布,避免人工介入。 并行处理为了保障源系统数据快速加载到数据仓库平台中,并能够支持ETL作业快速并行地完成,数据仓库平34、台应采用MPP海量并行处理架构,支持海量数据自动并行处理,无需人工参与。 SQL优化数据仓库平台应该具备自动优化SQL脚本的基本能力,从而达到最大化系统的吞吐量和最小化争夺系统资源,同时支持数据库管理员进行手工的SQL优化。 平台扩容为了保障业务的连续性,且最小化的人工参与,因此数据仓库平台扩容需要将停机时间最小化,避免数据的全量备份和全量恢复,同时避免人工参与带来的操作风险。 易管理数据仓库平台应提供集中的、图形化的、统一的运维工具,避免多套运维工具之间来回切换,方便运维管理人员进行集中管理。 数据加载时效性数据仓库平台将从众多不同的源系统获取原始数据,不同类型数据加载的时效性要求不同,包括35、每天数据的批量加载、准实时的分钟级加载和实时的数据加载等,数据仓库平台需满足从多个数据源采用不同加载方式和时效性要求的数据采集。 动态负载管理数据仓库平台将根据使用人员的角色来制定资源使用的优先级,不同使用人员的角色将对应大数据中心内的用户类型,由于不同使用人员在不同时段的响应优先级是不同的,为此数据仓库平台应具备按照不同的用户类型在不同时段分配不同的资源权限,资源使用比例的调整无需人工介入,由系统完全自动实现。 敏捷分析考虑到大数据中心未来将服务于多个服务对象,包括业务部门或者政府机构等,由于不同服务对象要求服务的内容和形式要求不同,为此数据仓库平台需具备多种服务能力,包括数据服务、应用服务36、和自服务等,数据仓库平台需具备自服务相关的能力。 查询灵活性数据仓库平台前端应用有一般的制式报表查询,也有条件随机的灵活查询,同时含有OLAP多维分析。数据架构要能够支持不同的查询类型,并在性能上有足够的保障。 用户并发度数据仓库平台需要支持多个部门或单位的用户并发访问,在一定的阶段后还需要提供对公众的服务,使用人员将逐步增多,因此数据仓库平台需能够支持多用户和多种形式的高并发访问,并在性能上有足够的保障。6.2 非结构化数据存储平台非结构化数据存储平台负责存储重庆轨道交通视频资料、建设图纸、影像资料、法律、法规、标准等非结构化内容数据。同时支持应急指挥系统数字化预案以及应急指挥系统处置报告等37、数据的存储。非结构化数据管理软件需满足以下要求: 支持各种格式的内容的存储和管理,包括影像、电子文档、表单等; 支持根据一定的策略对报表等内容数据进行自动分发; 提供丰富的API、Web Services访问等接口; 支持内容对象的分级、分类存储; 支持内容信息的属性检索和全文检索; 提供数字优化技术,提供高性能存取访问; 支持分布式缓存部署、存取缓存服务; 支持事件驱动架构,提供事件及订阅机制;可以通过内容的变化来触发相应的事件处理; 提供对业务的活动内容支撑能力; 支持与Microsoft Office/Outlook的无缝集成, 能够在Office软件中直接进行内容操作; 支持数据完整性38、一致性控制; 提供灵活的系统扩展能力; 支持主流操作系统,如Windows、Linux、AIX、HP UNIX、Solaris等; 支持各种主流应用中间件,例如:Websphere、WebLogic、Jboss等; 支持图形化的流程建模工具;建模简单易用,通过拖拽的方式即可实现; 提供完善的存储、备份方案及对在线、近线、离线数据的管理策略; 提供归档数据的流程化管理(BPM功能); 非结构化管理软件需支持数据仓库、应用中间件等平台产品;6.3 数据采集平台设计数据采集是大数据中心项目的关键部分,通过多种技术准实时或实时地从源系统中抽取数据,抽取过来的数据首先到达获取层进行预处理,然后经过转换39、等工作到达存储层,形成大数据中心的核心数据。具体接口方式需要在初设方案中确定。6.3.1 数据抽取从数据源系统获取数据,在实施时需要综合考虑业务需求、抽取效率、源系统代价等因素确定抽取策略,抽取策略包括抽取方式(增量、全量)、抽取时机、抽取周期等。 支持增量或全量、异步或同步抽取方式; 支持灵活设定抽取频率; 支持多种不同系统平台和数据类型的数据抽取。包括各种关系型数据库系统、非结构化数据、半结构化数据、各种文件格式的源数据等。6.3.2 数据映射源系统数据通过整合从源系统进入到大数据中心,在数据整合过程中通过数据映射方式进行转换,数据映射主要定义数据结构、数据定义方面的映射关系。 提供图形化40、可操作数据映射界面; 提供多种关系的数据映射方式,如一对一、一对多、多对一、多对多。6.3.3 数据转换数据转换包括格式和类型转换、数据翻译、数据匹配、数据聚合以及其他复杂计算等。多数情况下,数据源到大数据中心之间的转换主要是格式转换、数据翻译、数据匹配,而数据聚合以及其他复杂计算主要在数据汇总时出现。 支持在不同业务系统之间数据转换; 支持不同的数据源系统平台; 支持对定义清晰的外部数据源的数据转换; 支持数据的定义、数据结构和错误数据的转换处理。6.3.4 数据检查对于文件接口的数据的检查,主要从接口数据的完整性、及时性和正确性三个方面进行检查,系统根据接收文件的时间、入库是否异常等角度进41、行分析;对于业务应用系统的数据库接口,系统主要从接口的及时性和一致性方面进行检查,通过比较源系统的相关指标,分析数据的可信度。 支持接口文件检查,包括文件名、记录数、实体完整性检查等; 支持接口数据检查,包括数据类型、实体完整性等。6.3.5 数据加载数据加载是指将抽取转换后的数据加载到数据存储层中,包括数据行加载和数据块加载。在综合考虑效率和业务实现等因素基础上确定数据加载周期和数据追加策略。 支持批量数据的数据库直接加载; 支持多个数据库连接,能够进行大量数据的并行加载; 支持自动与手工预加载的流程。当日常数据加载出错,一般采用人工干预的方式来进行,这时需提供一个数据重新接收、加载的操作界42、面; 支持多种加载数据的方式,如直接追加、全部覆盖、更新追加。6.3.6 异常控制主要通过计数统计数平衡、拒绝数据量等方便评估数据复制、ETL的具体运行情况,以发现数据整合过程中有关数据的问题,并进行必要的处理。 支持校验点。当外部数据记录特别庞大时,如果因为某种原因发生故障中断后,可以从最近的校验点开始处恢复处理; 支持外部数据记录的错误限制定义,同时将发生错误的数据记录输出。6.3.7 作业管理ETL作业管理主要包括初始化作业、日常ETL作业、日常复制作业、异常处理作业等,同时要求对并发作业、高负载作业有良好的管理。对于某些特定应用,应该考虑采用统一的作业控制工具进行作业调度和管理。 提供43、图形化可操作任务调度与管理配置界面; 支持任务属性配置,可以对各项任务的属性进行配置,并保存在后台配置文件中,以备任务调度按序执行; 支持总任务的调度,使其按照设置条件自动按序执行任务; 支持分任务的调度,可按照任务类型、时间、区域等按照各自设置好的条件进行任务的调度; 支持任务的回退,需要对某几项任务进行重新调度时,可以将任务回退到需要重新调度的周期。6.4 企业数据模型设计数据模型是连结和集成各种数据源的手段,它也是存放业务规则和过程的场所。大数据中心建设成功与否,在很大程度上取决于是否有一个稳固的、全面的、灵活的逻辑数据模型。逻辑建模是大数据中心实施中的重要一环,因为它能直接反映出业务部44、门的需求,同时对系统的物理实施有着重要的指导作用。重庆轨道交通大数据中心的核心就是建立重庆轨道交通的“数据地基”,大数据中心将采用数据分析领域先进的交通行业逻辑数据模型,基于行业的逻辑数据模型,结合重庆轨道交通的数据及业务条件,定制化重庆轨道交通的企业级数据模型,支持数据模型稳定和可扩展等,支持持续的分析应用拓展。参考北京地铁数据模型的建设经验,重庆轨道交通大数据中心的数据模型示意图如下:6.5 数据分层存储根据最佳经验,大数据中心的数据存储需要划分为三层:临时数据层(ODS层)、基础数据层、汇总数据层和应用数据层。每一层采用不同的设计和开发策略,保障其功能定位。6.5.1 临时数据层(ODS45、层)大数据中心采用多种技术从源系统中抽取数据,加载方式包括实时加载、准实时加载和定时加载,为了保障数据在短时间完成大数据中心,同时降低对前端应用访问大数据中心数据的影响,在大数据中心内设置临时数据区,然后再执行临时数据层到基础数据层的数据转换,同时可在临时区进行数据统计或者即席查询。从设计上,临时加载层主要是为了生成业务系统的镜像区,保存业务系统的镜像数据,它是数据进入核心基础层之前的准备,其特点是尚未进行数据转换,是基础数据层的数据来源。与业务系统不同的是,临时加载层含有从多个业务系统加载进来的镜像数据,是业务系统的未加处理的合集,可供数据镜像分析查询与跨系统分析。从实现上,临时加载层将保留46、数据源抽取的数据,数据存储的周期不要求太长,一般在几天到几周。数据存储上需要保留和源系统同样的物理表结构。6.5.2 基础数据层基础数据层需要结合源系统的数据现状,切实考虑未来数据和应用的发展需要,参考交通行业逻辑模型,开发具有先进性、高可靠性、高可扩展性和高效性的数据模型,有效地组织和存储交通管理行业的信息资源,支撑大数据中心目前和未来的各种管理和分析型应用。从设计上,基础数据层是大数据中心的核心,需要支撑大数据中心所有主题的数据存储,同时支持主题域、实体和数据型的扩展。交通行业数据模型是构建数据基础层的核心技术,需要能够全面覆盖交通行业的数据内容,有效支撑交通行业的分析业务场景,满足大数据47、中心长期的业务发展需求,因此基础数据层数据模型要有良好的开放性、可扩展性、易操作性。从实现上,基础数据层的建设要根据交通行业数据模型做很好地客户化,物理表结构设计要参照交通行业数据模型,严格遵循第三范式,减少数据冗余,提高访问效率。6.5.3 汇总数据层为了提升应用数据层的数据生成效率,汇总数据层将在基础数据层基础上进行不同粒度的轻量级汇总或者高度汇总,汇总数据层存放的数据可以是应用数据层的多个结果数据的源数据,即可重复使用。由于汇总数据层是中间数据,因此业务应用平台并不直接访问。汇总层数据通常采用星型或者雪花型设计方法,提升数据的访问效率。6.5.4 应用数据层应用数据层设计是基于结合行业最48、佳实践、结合本项目具体业务需求进行本地化的模型落地,主要用于直接支撑大数据中心的指标查询、报表统计、自助分析、多维分析、数据挖掘等应用。6.6 数据治理数据治理包括数据盘点、数据标准制定、数据质量管理、元数据管理和四个部分,数据盘点是对已有和新增的业务数据进行摸底调查,了解清楚各业务系统的技术架构、系统性能、数据状况等。数据标准将形成一系列的标准规范,包括源系统接口规范、业务指标规范、元模型规范等,有助于推进重庆轨道交通的数据标准化工作。数据质量管理是从数据采集、处理到分析结果端到端的全流程数据质量监控,发现数据质量问题,及时告警,并形成数据质量知识库,支持数据质量问题的溯源。元数据管理是用于49、管理业务口径、数据模型、数据管理职责等的,支持元数据的制定、变更和分析等,并提供前端应用供用户检索和分析等,如数据血源性分析。6.6.1 数据盘点数据盘点是详细了解原有各业务系统的技术架构、数据状况和数据评估的过程,工作过程包括资料收集、表级调研、字段级调研、样本数据分析和ER图复原、信息调研报告编写和信息调研报告评审等多个环节,需与各业务系统的主管部门和开发商进行沟通,对于无法解释清楚的数据,需提供对应的解决方案,刻画出其数据的准确含义。6.6.2 数据标准标准化工作是大数据中心建设的基础,在平台建设过程中,需完成系统建设及运营所需的数据标准、技术标准、业务标准、运营维护管理制度和流程等的编50、制。在标准制定过程中需保证所有标准规范设计的合理、高效,确保各业务平台无歧义地管理、获取、共享和理解信息。数据标准制定中一项重要任务是制定重庆轨道交通统一指标体系,在统一指标体系中需明确定义所有相关指标的编码、名称、定义、类型计算方法、指标作用、数据来源、责任主体、标准区间、相关说明等内容,并以元数据的形式在系统中体现。6.6.3 数据质量管理数据质量管理模块的建设目标是:在数据处理的主要阶段设置数据质量检测点,并要求实现对数据源系统数据质量的监控,支持对数据质量的全程监控。在各数据质量检测点上,可灵活配置数据质量检查规则,并提供常见问题的处理方法; 建立有效的数据质量监控机制,提供全面及时的51、数据质量报告,预防和控制错误范围的扩大。加强数据质量监控技术与管理手段的配合,着重关注运营大大数据中心系统数据来源和数据输出的数据质量,明确相关责任; 在数据质量监控界面上集成元数据信息,实现拓扑呈现功能,在各种拓扑呈现视图上叠加显示各类数据质量信息,提供数据处理状态和质量状况的全局视图; 建立数据质量管理流程,确定数据质量问题相关处理岗位的职责和配合方式,保证数据质量问题能够及时、有效地得到解决; 逐步完善数据质量管理知识库,积累数据质量问题及其处理过程的相关知识,为相近问题的处理提供参考,并为数据质量统计报告的生成提供数据支持; 开发数据源接口质量管理应用,侧重加强对数据源侧数据质量的监控52、和分析,并实现数据管理流程与数据源侧相关管理流程的对接,促进跨系统的数据质量管理过程的协调和互动。6.6.4 元数据管理元数据管理为正确理解和操作数据提供支撑,它贯穿运营大大数据中心系统构建、运行和维护的整个生命周期。元数据管理的主要目标是:1)加强运营大大数据中心系统数据的管控力度,增强系统自身管理能力:元数据管理为用户提供统一的元数据管理手段。通过建立元数据管理模块,可以对运营大大数据中心系统的元数据进行收集、存储、输出、查询和分析等操作。用户通过元数据管理模块浏览元数据,并可以理解各种元数据的定义和系统的整个运作过程,以及相关元数据在其中发挥的作用,从而更有效地理解和控制系统的运行;2)53、实现元数据的统一管理,提升系统易用性:应用元数据管理模块之前,元数据分布在运营大大数据中心系统的不同逻辑组件中,业务规则和技术元数据是分离的,由不同系统以不同格式保存,并且用户界面也不相同,不利于业务人员和技术人员对元数据的管理和使用。在使用数据进行相关决策时,分析人员和决策者需要了解自己的需求与系统中数据的关系。元数据管理模块的建立,使得技术人员和业务人员可以统一地对系统中的元数据进行管理、监督和探查;3)为数据质量管理子系统提供支持:元数据为数据质量管理体系架构中的功能层和应用层提供信息支撑。以元数据管理为基础建立数据质量监控模块,进行运营大大数据中心系统数据质量的全程监控,为数据的准确性54、一致性打下坚实的基础。7 大数据中心分阶段建设规划7.1 概述根据重庆轨道交通线网建设及运营的需要,大数据中心的建设需满足到2020年重庆轨道交通400公里运营里程、250个车站、日均600万客流的运营管理要求,在充分考虑整个工程项目的复杂度和数据获取可能遇到的问题的情况下,将大数据中心建设分为两个主要阶段进行建设实施:第一阶段为速赢建设期(12个月),第二阶段为优化提升期(24个月),两轮建设时间共3年。第一阶段,速赢建设阶段:为期12个月,主要工作是建立重庆轨道交通大数据中心的基础环境,建立完整的数据仓库平台,实现初期规划数据的采集,以尽量多的数据集中为目标,建立完整的数据架构和企业数据55、模型,构建基础数据管控能力,构建基本的报表统计、指标查询和少量专题分析应用。第二阶段,优化提升阶段:为期24个月,主要工作是基于已经建成的基础环境,逐步扩展数据采集的范围,提升数据采集的时效性,扩大应用范围,形成更多有价值的专题分析,不断提升数据质量和数据管控能力,使大数据中心成为企业进行生产作业、运营管理、企业管理和规划决策的强有力的分析支撑工具,数据价值全面体现在企业运营管理各个环节,为创造重庆轨道交通特有的数据文化构建坚实的基础。7.2 数据接入规划根据重庆轨道交通集团信息化现状,考虑到众多信息化系统标准不统一、建设厂家不同、数据质量差异大的情况,建议: 第一阶段建设重点接入ACC客流数56、据、票务数据、EAM设备资产维修数据以及一些重点线站的基础数据,根据实际情况选择性接入尽可能多的行车、信号、通信、监控等生产运营数据以及企业管理类数据(如财务、人力、预算、投资等)。 第二阶段在第一阶段已接入数据的基础上继续扩大数据接入范围,基本实现全企业数据的统一集成。7.3 数据容量测算大数据中心数据采集存储的范围包含所有接入的业务生产系统产生的票卡、交易、行车、设备、监控、采购、人员、财务等数据,数据存储遵循“静态数据在线永久保存、动态数据在线保存10年”的原则。结合重庆轨道交通目前数据存储现状,参考其他相关地铁公司大数据中心规划建设情况,每条线路每年新产生数据在0.8TB左右。一阶段为57、速赢建设阶段,满足2017年底数据存储要求,考虑10的数据冗余。二阶段为优化提升阶段,满足2020年底数据存储要求,除了新线增多之外,还需接入更多系统的数据,考虑30数据冗余,数据容量计算如下表:综上所述,重庆轨道交通大数据中心第一阶段结构化数据仓库存储按满足30TB非压缩数据存储设计,第二阶段2020年结构化数据仓库满足60TB非压缩数据存储设计,非结构化数据存储暂按50TB考虑。7.4 建设范围规划重庆轨道交通大数据中心将由一个基础数据平台、五大业务平台、三大管理平台构成,分阶段建设顺序和重点如下:第一阶段: 重点建设基础数据平台中的数据仓库平台,同步开展数据治理工作,配套建设元数据管理平58、台、数据质量平台和基础管理平台,为全企业数据集成统一打下坚实基础。初步构建统计分析平台、运营评估平台、应急辅助决策平台和信息服务平台,基于以上四个业务平台实现基础指标报表的实时统计工作及部分专题分析应用。 第一阶段是大数据中心建设重要的基础阶段,如何快速、高效、准确的集成源系统数据是一阶段项目建设能否成功的关键,所以建议第一阶段大数据中心设备都部署在重庆轨道交通现有系统比较集中的机房,方便进行数据接入。第二阶段: 根据需要提升数据仓库平台的数据接入、数据存储、数据处理能力,整合更多企业信息系统的数据,不断丰富数据分析应用,实现跨域分析能力、综合分析能力的全面提升。进行全面的数据治理工作,配套提59、升元数据管理平台、数据质量管理平台及基础管理平台的能力。 新建非结构化数据存储平台,逐步整合企业非结构化数据。新建GIS平台,实现通过地理信息系统进行相关数据展现。新建数据仿真平台,利用数据仿真工具、基于平台的数据支撑,提升大数据中心的形象化分析能力。 第二阶段是大数据中心优化提升阶段,不仅要考虑数据容量的扩充、应用的扩展、数据质量的提升,还需在数据安全性、系统高可用性等方面进行全方位考虑,建议在第二阶段进行双中心的建设。7.5 双中心规划建议目前,在已建设大数据中心项目的地铁企业中,北京地铁、广州地铁、深圳地铁都已建设或者正在建设双中心系统。考虑到重庆轨道交通大数据中心长远的发展,在第一阶段60、项目打下坚实基础的情况下,建议在第二阶段建设过程中考虑双中心系统的建设,主中心在一阶段数据仓库的基础上进行扩容,备中心新建数据仓库系统。主备中心分别部署在不同的机房,当一个中心出现故障的时候,另外一个中心可以全面无缝接管所有业务访问,保证业务的连续性。参考北京地铁、深圳地铁双中心建设模式,大数据中心主中心采用高性能数据仓库平台,保障正常情况下业务访问的高效性,备中心可采用大容量数据仓库平台,在主中心出现故障的情况下,可保证业务访问的可靠性。采用数据双加载方式把源系统数据同时加载到主备中心,并通过数据检查、数据同步的方式保证两个中心数据的一致性。通过部署智能策略路由访问工具,既可以在一个中心出现61、故障情况下保证业务访问连续性,也可以在双中心都正常的情况下基于访问策略设定不同的业务访问不同的中心,例如,针对实时性要求比较高、访问量比较大的报表指标、即席查询等业务可以访问主中心,实时性要求不高但是数据访问量、计算量较大的运营评估类业务可以设定访问备中心,这样可以充分利用双中心的数据处理和访问能力。8 大数据中心第一阶段业务应用设计8.1 统计分析统计分析平台主要建设目标是依托大数据中心提供的强大数据支撑服务,结合网络化运营管理和决策分析需要,建立面向多用户的信息集中共享、资源高效利用、运行安全可靠的轨道交通线网运营大大数据中心服务平台和综合信息统计分析查询平台。实现跨业务的数据整合共享,提62、供灵活的数据查询功能、强大的数据分析功能以及可定制的报表报告功能,满足重庆轨道交通各部门开展各项业务的数据需要,提高网络化运营管理水平。统计分析平台主要包括指标管理、指标灵活查询、OD 分析、报表管理等功能模块。8.1.1 指标管理指标体系的建设是一个长期、不断完善的过程,如何满足业务需求是指标体系建设的重要关注点。运营指标体系的构建按照目录树的方式构建,系统中将不限制级数,但在实际应用中建议一般不超过4级目录,每级目录按照业务专业进行分类管理,指标只能建立在目录分类下。系统支持特定权限用户进行指标目录树和具体的维护工作,包括新增、修改、离线、删除等处理,每一步具体操作系统都将有日志记录。系统63、支持对整个指标体系进行生命周期管理。在项目建设过程中,将通过元数据对整个运营指标体系进行管理,对所有指标进行严格定义,包括指标名称、单位、计算公式、数据来源、统计方式、统计精度等。运营指标体系主要包含客流类、清算类、票务类、列车运行类、设备类、服务类及能耗类指标等。8.1.1.1 客流类指标客流信息类指标指标名称定义单位车站进线量统计期内,在轨道交通指定车站进站,乘坐该站所属指定线路列车的乘客数量。人次线路进线量统计期内,在运营线路所属车站刷卡进站的乘客总量。人次路网进线量统计期内,路网各运营线路车站刷卡进站的乘客总量。人次线路出线量统计期内,在运营线路所属车站刷卡出站的乘客总量。人次路网出线64、量统计期内,路网各运营线路车站舒卡出站的乘客总量。人次换乘站换乘量统计期内,换乘站线路间各方向换乘乘客的总量注:支持换乘到不同方向的统计输出人次路网换乘量统计期内,进入轨道交通路网的乘客在换乘站由一条线路换乘到另一条线路的总量。人次线路客运量统计期内,线路运送的乘客数量人次路网客运量统计期内,路网中各条运营线路运送乘客总量注:支持异常数据的单独处理和统计输出人次车站集散量统计期内,轨道交通指定车站进出站客流量和换乘量总和人次车站定点实时流量统计期内,车站指定地点(出入口、安检处、闸机、楼梯、扶梯、站厅、站台、换乘通道及列车上等)乘客数量注:只限于车站有视频监控设备的地点人次线路客运周转量统计期65、内,运营线路乘客乘坐距离的总和人次公里路网客运周转量统计期内,路网内乘客乘坐距离的总和。人次公里负荷强度统计期内,单位运营长度上平均承担的客运周转量。人次公里/公里路网瞬时客流量截止统计时刻内,路网内乘客总数量人次客运强度统计期内,单位运营长度上平均承担的客运量人次线路OD客流量统计期内,在轨道交通指定线路间刷卡进出的乘客数量人次路网OD客流量统计期内,进入路网的乘客刷卡进出数量人次本线进出客流量进站与出站均属于本线路的乘客在统计期内的数量人次本线进它线出客流量进站属于本线路而出站不属于本线路的乘客在统计期内的数量人次它线进本线出客流量进站不属于本线路而出站属于本线路的乘客在统计期内的数量人次66、途径本线客流量进站与出站均不属于本线路,但按照乘客出行路径经过本线路的乘客在统计期内的数量人次路网换乘系数统计期内,乘客在路网内完成一次出行需乘坐平均线路条数无线路换乘次数统计期内,指定线路进站的乘客完成一次出行需要换乘的次数次路网换乘次数统计期内,路网进站乘客完成一次出行需要换乘的次数次线路换乘分次数客流量统计期内,在轨道交通指定线路进站完成一次出行,需要换乘不同次数的乘客数量(按照换乘次数0,1,2,3,4,5.)人次路网换乘分次数客流量统计期内,在轨道交通路网进站完成一次出行,需要换乘不同次数的乘客数量(按照换乘次数0,1,2,3,4,5.)人次线路换乘比例统计期内,本线路进站的乘客中,67、在其他线路出站的乘客所占比例。无路网换乘比例统计期内,乘客在路网完成一次出行,需换乘的人数与进站量的比值。无线路乘距统计期内,在某一线路上乘客一次乘车的距离(乘客乘坐距离按照1KM,2KM,3KM,4KM分别有多少人)公里线路平均乘距统计期内,在某一线路上乘客一次乘车的平均乘车距离公里路网乘距统计期内,路网中乘客一次出行全程的总乘车距离公里路网平均乘距统计期内,路网中乘客平均一次出行全程的总乘车距离公里线路乘车站数统计期内,在某一线路上乘客一次乘车的站数(按照乘客乘车站数1,2、3,4,5,。分步统计)站线路平均乘车站数统计期内,在某一线路上乘客一次乘车的平均乘车站数站路网乘车站数统计期内,路68、网乘客一次出行的乘车站数站路网平均乘车站数统计期内,路网中乘客平均一次出行全程的总乘车站数站线路乘车时间统计期内,在某一线路上乘客一次乘车的时间(按照乘客乘车时间分:1,2,3,4,5分钟)分钟线路平均乘车时间统计期内,在某一线路上乘客一次乘车的平均乘车时间分钟路网乘车时间统计期内,路网乘客一次出行的乘车时间(按照乘客乘车时间分:1,2,3,4,5分钟)分钟路网平均乘车时间统计期内,路网中乘客平均一次出行全程的总乘车时间(按照乘客乘车时间分:1,2,3,4,5分钟)分钟付费乘客比例统计期内,轨道交通付费乘客占总乘客的比例注:付费票种包括但不限于单程票、出站票、定值纪念票、储值卡、一日票等无非付69、费乘客比例统计期内,轨道交通非付费乘客占总乘客的比例注:非付费票种包括但不限于员工卡、福利票等无线路人次收入统计期内,轨道交通各线路运送乘客获得的平均收入元/人次运营企业人次收入统计期内,运营企业所辖线路每运送一次乘客可获得的平均收入元/人次路网人次收入统计期内,路网(不含机场线)每运送一次乘客可得到的平均收入元/人次线路乘客出行成本统计期内,轨道交通指定线路进站的乘客完成一次出行需要花费的费用(2,3.)元元线路平均出行成本统计期内,轨道交通指定线路进站的乘客完成一次出行需要花费的平均费用元路网乘客出行成本统计期内,轨道交通路网进站乘客完成一次出行需要花费的费用元路网平均出行成本统计期内,轨70、道交通路网进站乘客完成一次出行需要花费的平均费用元线路运价统计期内,轨道交通乘客每乘坐1公里,线路可获得的收入元/人次公里路网运价统计期内,轨道交通路网乘客一次出行每乘坐1公里需要花费的费用元/人次公里断面运力统计期内,单位时间内经过该区间的列车数与列车定员的乘积。人断面高峰小时运力统计期内,在以小时为单位计算经过该断面的列车数与列车定员的乘积,运营线路断面运力的最大值。包括发生的时段。人断面客流量统计期内,单位时间单向通过运营线路某一断面的乘客数量。人次高峰小时最大断面客流量统计期内,在以小时为单位计算断面客流量的情况下,运营线路断面客流量的最大值。包括发生的时段。人次8.1.1.2 清算信71、息类指标清算信息类指标指标名称定义单位应收票款统计期内,在轨道交通联网收费系统(ACC/AFC)产生的售票、充值、补票、退票、恢复、抵消金额。注:需支持一票通、一卡通及不同交易类型分别统计及汇总元实收现金统计期内,各运营企业向银行实际交存的轨道交通AFC系统票款金额元应付运费统计期内,轨道交通清分给各运营企业的金额注:需支持一票通、一卡通及不同清分类型分别统计及汇总元应收应付净额统计期内,轨道交通应收票款与应付运费的差额元实收与应收差额统计期内,轨道交通实收票款与应收票款的差额元8.1.1.3 票务信息类指标票务信息类指标指标名称定义单位库存量统计期末,轨道交通一票通票票库存总量注1:包括所有72、区域库存数量合并统计和分开统计注2:支持分票种、分状态统计张库存安全阈值轨道交通一票通票卡库存安全警戒值张付费区流失量统计期内,发售的轨道交通一票通在付费区流失的数量张非付费区流失量统计期内,发售的轨道交通一票通在非付费区流失的数量张流失总量统计期内,发售的轨道交通一票通的流失总数量张流失率统计期内,发售的轨道交通一票通的流失总量占一票通发售总量的比例无票卡流入量统计期内,轨道交通一票通票卡流入指定区域数量注1:支持分票种统计张票卡流出量统计期内,轨道交通一票通票卡流出指定区域数量注1:支持分票种统计张票卡流动量统计期内,轨道交通一票通票卡流入与流出差值注1:支持分票种统计张一票通票使用次数统73、计期内,轨道交通投入运营的一票通票使用次数注:一票通票仅指可回收票种次使用区间车票次数统计期内,轨道交通一票通票卡在某使用区间内数量次使用区间票卡所占比率统计期内,轨道交通在某使用区间内的一票通票卡占一票通票总量的比例无8.1.1.4 列车运行类指标列车运行信息类指标指标名称定义单位线路图定开行列次线路图定开行列次:统计期内,按照线路计划运行图或特定情况下制定的运行图开行的总列次列线路实际开行列次线路实际开行列次:统计期内,列车为完成运营生产任务在正线上行驶的次数,分为载客列次和空驶列次两部分, 包括计划外的加开列次列线路加开列次线路加开列次:统计期内,线路根据实际需要不在计划运行图内而增加开74、行的总列次列走行公里统计期内,线路运营车辆所行驶的全部里程。注1:“正线调试公里”含异线过轨列车、停车场与车辆段调车、非运营线试验车里程;注2:“救援公里”包含救援与被救援列车里程。注3:若列车在区间清人,“清人后运行公里”以列车开行方向下一站开始计算里程。车公里运营公里统计期内,为运营业务在运营线路上空车行驶和载客行驶的全部里程。注1:“空驶公里”包括两端折返线间的里程、车辆段(场)联络线的里程和正线空驶里程。轧道车空驶里程、为运营业务放空到某站(段)的预备车里程、轧道兼通勤车里程均计入列车运营公里。注2:“载客公里”为载客列车始发站至终到站之间的行驶里程。车公里线路日均开行列次线路日均开行75、列次:统计期内,列车为运送乘客在线路上平均每天所行驶的次数列次/日列车运行图兑现率列车运行图兑现率:运行图计划执行过程中,实际根据计划开行列次(不包括加开列次)与运行图定开行列次之比,用以表示运行图计划执行情况无8.1.1.5 设备类指标设备信息类指标指标名称定义单位车辆系统设备故障次数统计期内,按图运行的线路列车车辆系统所有设备发生的故障次数次车辆碎修率统计期内,轨道交通的线路列车每走行一百万车公里,线路所有车辆发生碎修次数。次/万组公里车辆系统设备故障率统计期内,按图运行的线路列车每走行一万车公里,车辆系统所有设备发生的故障次数次/万车公里车辆故障晚点率统计期内,轨道交通的线路列车每走行一76、万车公里,因车辆故障导致晚点的次数次/万车公里供电系统设备故障率统计期内,轨道交通的线路列车每走行一万车公里,新线供电系统发生的故障次数次/万车公里信号系统设备故障率统计期内,按图运行的线路列车每走行一万车公里,线路信号系统发生的故障次数次/万车公里信号系统可用性统计期内(如试运行最后六天),信号系统因故中断造成的列车晚点分钟分钟/6天信号故障掉线率信号故障掉线率:统计期内(如试运行最后30天),因信号系统故障造成的掉线累计件数件/30天设备完好率自动售检票系统测试期内,完好设备数与所有参测设备数的比值无设备准确率测试期内(规定时间内),自动售检票系统数据传输完整一致,设备功能正确的设备数与所77、有参测设备数的比值无全线测试交易数据故障率动售检票终端设备全线测试交易数据故障率在开通前的故障率无屏蔽门系统设备故障率统计期内,轨道交通的线路列车每走行一万车公里,线路信号系统发生的故障次数次/万车公里8.1.1.6 服务类指标服务信息类指标指标名称定义单位线路运营时间统计期末,轨道交通各线路每日向乘客开放运营的时间。注:线路运营时间为第一班车发出时间至最后一班车到达终点站的时间。秒站台、站厅平均温度、湿度系统统计获得摄氏度/%乘客有效投诉率统计期内,乘客有效投诉次数与百万人次客运量之比。注1:有效投诉人次是指通过服务热线、网站、媒体、来信来访受理的,且乘客留下详细住址或工作单位、姓名和联系方78、式,经过调查属实的有责投诉乘客人数。注2:针对同一事件的多次有效投诉应记为多次。次/百万人次乘客满意率统计期末,通过抽样调查和统计分析,乘客对轨道交通运营服务满意的比例。无垂直电梯可靠度统计期内,线路垂直电梯设备实际服务时间与计划服务时间的比值无自动扶梯可靠度统计期内,线路自动扶梯设备实际服务时间与计划服务时间的比值无售票/充值机可靠度统计期内,线路售票机和充值机设备实际服务时间与计划服务时间的比值注: 对于售票充值一体机,若售票或者充值中一项功能故障时,视为故障时间。无进出站闸机可靠度统计期内,线路进出站闸机设备实际服务时间与计划服务时间的比值无8.1.1.7 能耗类指标列车运行信息类指标指79、标名称定义单位牵引能耗统计期内,运营车辆在线路和车辆段/停车场上运行所消耗的电能。度动力照明能耗统计期内,线路和车辆段/停车场动力照明能耗之和。注: 动力照明能耗不包含商业用电等非营运性质的能耗。度进线电量统计期内,运营线路耗费各类电量的总和。度8.1.2 CoMET指标根据2001年资料,CoMET和 Nova metros采用共有32 项KPIs的指标体系,分为六类,包括17项高级指标(下文中加下划线表示)和 15项次级指标。背景情况类:网络规模和客流量、运营运力公里和乘客人数、车公里和网络线路公里;资产利用类:运力公里/线路公里、乘客公里/运力公里、乘客人数/车站、高峰时车辆可使用百分比80、;可靠性/服务质量类:事故间运营车公里收入、事故间车小时、车小时/列车晚点小时、车运营小时/总列车晚点小时、总乘客小时延误/乘客人数、正点列车数/总列车数;效率类:乘客人数/总员工承包商投入小时、车公里收入/总员工承包商投入小时、运力公里收入/总员工承包商投入小时、计划开行列车数/年/司机;财务类:总商业收入/运营成本、总成本/运营车公里收入、服务运营成本&员工工时/车公里、维护成本&员工工时/车公里、管理成本&员工工时/车公里、投资成本/运营车公里收入、总成本/乘客人数、运营成本/乘客人数、票价收入/乘客人数、平均运营成本/车站;安全类:总死亡人数/总乘客人数、自杀事件次数/总乘客人数、出现81、健康状况人数/总乘客人数、犯罪事件次数/总乘客人数、事故次数/总乘客人数。各类相关指标的详细分类如下表所示:类指标来源指标指标说明背景情况类网络规模和客流量网络规模客流量运营运力公里和乘客人数运营运力公里乘客人数车公里和网络线路公里车公里网络线路公里资产利用类运力公里/线路公里运力公里反映单位长度线路的乘客输送能力线路公里乘客公里/运力公里乘客公里反映运力的利用情况运力公里乘客人数/车站乘客人数车站的平均进站乘客数,反映车站整体的利用情况车站数高峰时车辆可使用百分比高峰时段可用于运营的车辆数占配属车辆数的比例,反映车辆的利用情况,用于评估车辆维修业务的绩效可靠性/服务质量类事故间运营车公里收入82、事故次数两次事故之间的运营车公里收入运营车公里收入事故间车小时事故次数两次事故之间列车安全运营的车小时数车小时车小时/列车晚点小时车小时列车晚点小时车运营小时/总列车晚点小时车运营小时反映列车运行正点的可靠性,比值越大,越可靠总列车晚点小时总乘客小时延误/乘客人数总乘客小时延误平均每位乘客延误时间乘客人数正点列车数/总列车数正点列车数反映的是正点率总列车数效率类乘客人数/总员工承包商投入小时乘客人数反映运营企业配属员工在完成乘客输送人数方面的工作效率总员工承包商投入小时车公里收入/总员工承包商投入小时车公里收入反映运营企业配属员工在完成客运周转收入方面的工作效率总员工承包商投入小时运力公里收入83、/总员工承包商投入小时运力公里收入反映运营企业配属员工在完成运力公里收入方面的工作效率总员工承包商投入小时计划开行列车数/年/司机计划开行列车数反映运营企业配置司机的工作效率司机数财务类总商业收入/运营成本总商业收入平均每单位运营成本的带来的商业收入运营成本总成本/运营车公里收入总成本平均每单位运营车公里收入需要投入多少总成本(包括建设、投资、运营、服务、维护成本等)运营车公里收入服务运营成本&员工工时/车公里服务运营成本每车公里需要多少服务运营成本和多少服务员工工时服务员工工时车公里维护成本&员工工时/车公里维护成本每车公里需要多少维护成本和多少维护员工工时维护员工工时车公里管理成本&员工工84、时/车公里管理成本每车公里需要多少管理成本和多少管理员工工时管理员工工时车公里投资成本/运营车公里收入投资成本每运营车公里收入需要多少投资成本运营车公里收入总成本/乘客人数总成本每输送一位乘客需要多少总成本,用来评估票价和政府补贴乘客人数运营成本/乘客人数运营成本每输送一位乘客需要多少运营成本,用来评估票价和政府补贴乘客人数票价收入/乘客人数票价收入平均输送一位乘客带来多少票价收入乘客人数平均运营成本/车站平均运营成本每座车站运营成本的平均值车站数安全类总死亡人数/总乘客人数总死亡人数一定时期内,因事故或意外等总死亡人数与总输送乘客数的比值总乘客人数自杀事件次数/总乘客人数自杀事件次数一定时期85、内,发生自杀事件次数与总输送乘客数的比值总乘客人数出现健康状况人数/总乘客人数出现健康状况人数一定时期内,出状况乘客人数与总输送乘客数的比值总乘客人数犯罪事件次数/总乘客人数犯罪事件次数一定时期内,发生犯罪事件次数与总输送乘客数的比值总乘客人数事故次数/总乘客人数事故次数一定时期内,发生各种事件次数与总输送乘客数的比值8.1.3 MOPES指标 基础指标基础指标可以分为线网指标和车站指标两类。1线网指标:包括运营线路条数、线路运营长度两个一级指标,并推演出网络运营长度、网络运营长度增长率两个推演指标。2车站指标:包括线路车站数、换乘车站总数两个一级指标,并推演出网络车站总数、平均站间距两个推演86、指标。各类相关指标的详细分类如下表所示:大类类别信息指标衍生指标线网指标线网运营线路条数网络运营长度网络运营增长率线路运营长度车站指标车站线路车站数网络车站总数平均站间距 绩效指标绩效指标包括客流指标、运行指标、服务指标、安全指标、能耗指标和成本指标五大类。1、客流指标:包括客运量、周转量、换乘量、运距/乘距、强度/负荷五个方面。2、运行指标:包括基础数据、速度利用率、里程利用率、兑现率、准点率、列车服务可靠度、清客频率。3、服务指标:包括乘客服务和设施设备可靠度两方面。4、安全指标5、能耗指标6、成本指标各类相关指标的详细分类如下表所示:大类类别信息指标衍生指标客流指标客运量线路日均客运量线87、路客运量增长率、网络日均客运量、网络客运量增长率、网络出行量增长率线路最高日客运量车站最高日客运量线路高峰小时高断面客流量列车高峰小时最大拥挤度网络日均出行量网络出行量比重网络最高日客运量网络客运量比重周转量线路日均客运周转量网络日均客运周转量换乘量换乘站日均换乘客流量网络日均换乘客流量、网络换乘系数运距/乘距线路平均运距、网络平均乘距强度/负荷线路客运强度、线路负荷强度、网络客运强度、网络负荷强度、网络出行强度运行指标基础数据线路配属车辆数(车型、编组)线路每公里配车数、单位运营长度的企业职工数、网络配属车辆数、网络每公里配车数、司机配备率、司机生产率、会员生产率线路高峰小时最小发车间隔企业88、职工数司机总数储值票使用率车辆设备引起的网络延误事件数信号设备引起的网络延误事件数供电设备引起的网络延误事件数工务设施设备引起的网络延误事件数屏蔽门引起的网络延误事件数其他设备引起的网络延误事件数员工因素引起的网络延误事件数乘客因素引起的网络延误事件数其他因素引起的网络延误事件数速度利用率旅行速度速度利用率里程利用率线路日均运营里程线路里程利用率、网络日均运营里程、网络里程利用率线路总行驶里程兑现率线路图定开行列次线路日均开行列次、列车运行图兑现率、网络日均开行列次、网络平均兑现率线路实际开行列次线路加开列次准点率线路准点列车次数线路列车准点率、网络平均准点率列车服务可靠度线路列车服务可靠度网89、络列车服务可靠度清客频率线路清客频率网络清客频率服务指标乘客服务乘客满意度(指数)变化率百万乘客有效投诉率有效乘客投诉回复率设施设备可靠度售票机可靠度储值卡充值机可靠度进出站闸机可靠度自动扶梯可靠度垂直电梯可靠度车站乘客信息系统可靠度列车乘客信息系统可靠度安全指标运营事故频率能耗指标线路列车牵引能耗网络列车牵引能耗网络动力照明能耗成本指标运营总成本车公里成本、人公里成本、运营成本比运营票务收入8.2 专题分析8.2.1 OD分析OD 分析支持业务分析人员对大数据中心中的OD 数据进行查询、计算分析和数据挖掘等操作,可以在时间、空间(O 点、D 点和途经)、票种三个维度上任意指定查询条件,实现任90、意条件范围的OD 查询,以及从不同的角度统计分析、汇总和展现所查询的结果。OD 分析主要通过对线网不同时空维度下OD 客流的分布及流向规律的深度分析,把握乘客出行路径规律,实现对线网整体客流规律、乘客出行行为信息的把握,辅助运营决策。8.2.2 线路、车站统一视图大数据中心的最大优势就是可以整合涉及地铁企业运营管理方方面面各专业的数据,进行统一分析。针对某条线路将涉及该线路的所有信息、数据、指标统一到一个层面,形成线路统一视图,运管人员可以方便的从各个角度监控、分析该线路的运营情况,从而灵活高效的制定运营计划并在应急事件发生时依据数据分析结果及时有效的做出相应的处理措施。针对某些某车站、特别是91、一些重点换乘站的数据、信息进行统一整合,形成车站统一视图,方便运营管理人员高效的对车站进行管理。构建车站统一视图、线路统一视图,可以为应急预案的编制、优化提供有效的数据支撑,也可以为数据仿真提供必要的数据支撑。8.2.1 客流预测为满足轨道交通路网运营需要,掌握轨道交通短时或未来的客流规模和时空分布趋势,需对不同阶段(包括实时客流预测、突发事件客流预测、大客流预测、日常短期客流预测、新线开通路网客流预测)的客流进行预测,具体包括轨道交通全日和分时间粒度客运量、断面客流量、进出站量和换乘量等指标,为运力配置计划提供模拟客流的数据支持,同时为轨道交通列车运行组织和车站客运组织提供重要依据,为政府运92、营管理部门和政府决策部门提供决策参考。8.2.1 运力运量匹配分析运力运量匹配分析是对网络中客流变化、满载率、各线运力之间的关联性、乘客需求的满足性的深入分析,能够为提高运输设备利用率、优化运力配置以及制定可靠的运行图提供参考。基于实践经验以及国内外轨道交通运力运量匹配的相关理论研究,提出运力运量匹配分析专题的方案,包含运力运量指标图形化监控展示、运力运量匹配优化建议。8.2.2 设备生命周期管理分析目前EAM系统已经实现了设备台账管理、设备维修管理,设备基本信息、维修保养信息已经相对比较全面,所以可以针对设备建立从采购、入库、使用、监控、维保全生命周期的管理分析模块,既可以在每个环节对设备进93、行单点分析,又可以建立全面分析模型,对设备实现涵盖各个生命周期环节的综合分析。8.2.3 物资供应链分析通过从EAM等系统获取物资采购数据、仓储管理数据、物资消耗数据、供应商数据等信息,建立物资供应链分析模型,从而实现: 优化采购计划及流程; 提高备品备件库存效率; 支撑建立备品备件预警制度; 逐步形成完善的供应商评价机制。8.3 第一阶段应用效果示意8.3.1 运管人员驾驶舱运管人员驾驶舱可以整合客流、行车、票务数据,对关键信息进行集中实时展现,方便运管人员进行统一监控。8.3.2 客流、OD专题分析基于客流专题分析,可以优化网络行车计划、客运组织方案和紧急情况处理预案。结合商圈居住数据、市94、政规划数据等,可提供新线路规划的数据支持,同时可预测新增线路对路网的影响。8.3.3 报表系统8.3.4 灵活查询各业务管理人员可以根据自己的工作需求,来进行灵活的查询分析,从而满足自己的工作需要。例如,通过对客流的分析,运营管理人员可以获取客流量的信息;而票务管理人员则可以根据客流量,确定线网各站点对票卡数量的需求。8.3.5 车站统一视图8.3.6 线路统一视图8.3.7 手机APP提供公众信息通过手机APP,公众可以方便的进行线路、站点、票价、车站设施等与地铁出行相关的信息查询,还可以方便的查询地铁站周边商业、医疗、娱乐、旅游等相关信息。9 大数据中心第一阶段工程进度大数据中心第一阶段建95、设,即速赢建设阶段:为期12个月,主要工作是建立重庆轨道交通大数据中心的基础环境,建立完整的数据仓库平台,实现初期规划数据的采集,以尽量多的数据集中为目标,建立完整的数据架构和企业数据模型,构建基础数据管控能力,构建基本的报表统计、指标查询和少量专题分析应用,具体工程进度示意图如下所示:10 项目风险与风险管理10.1 风险识别和分析风险控制是项目建设和运营管理中的重要工作内容,要遵循成熟的方法和严谨的工作过程,一般来看风险管理流程包括风险计划、风险分析,风险评估、风险处理四个方面的工作,数据中心项目复杂、涉及单位众多,数据接口和数据质量问题复杂,因此重庆轨道交通大数据中心建设和运营过程中心必96、须对风险的全程管理和控制,以达到风险控制的目标。关键风险总结如下:(1)集成商的行业经验不足风险。集成商对轨道交通行业核心业务缺乏经验,很可能导致项目需求定义和解决方案设计出现重大偏差,在实施过程中才逐步暴露,将导致项目交付时间和质量不可控,且难以短期弥补;(2)项目需求范围和深度变化的风险。业务部门对数据中心需求理解在项目初期往往并不清晰,但随着项目开展,将产生大量的需求重新定义变更,极易导致项目周期调整和项目质量不可控,需要提前做好资源投入准备,做好项目分期和确认工作;(3)数据接口配合风险。大数据中心建设涉及到众多系统,属于不同部门和开发商,进行数据接口需要各方配合,部分数据接口可能涉及97、到复杂的数据转换工作,需要大量的人员、技术和时间的投入,集成商必须充分考虑相关资源的投入;(4)大数据中心和应用系统数据统计口径不一致,导致出现多套数据,降低数据中心分析的有效性。应规划完整的数据架构,大数据中心确保采集服务化业务分析要求粒度的数据,保证数据统计的一致性,集团领导应积极推动数据中心数据的独立性和完整性建设,避免集团数据在各业务领域内单独使用,缺乏独立性。(5)运行过程中数据质量不可控,导致大数据中心应用效果下降。大数据中心运营过程中,应充分重视数据质量的管控,借助规范的数据治理体系建设,借助工具和考核,确保数据质量,才能保证大数据中心应用的有效性。10.2 风险对策和管理项目建98、设方应对本期工程建设存在的技术风险、非技术风险、项目管理风险等各种风险进行全面的分析和评估,制定详细的项目风险分析报告和项目风险防范计划,并在项目实施过程中对项目风险进行跟踪和控制,对事先无法预计的异常情况及时的制定应对措施,确保项目目标的顺利完成。风险管理主要设计以下一些内容:1)技术风险及规避措施;2)业务风险及规避措施;3)顺序安排风险及规避措施;4)人力资源风险及规避措施;5)各个系统的配套建设进度的风险及规避措施;6)挖掘模型建设过程中因需求变动、数据源变更等导致的风险及规避措施;7)实施过程中由于版本变动或其他的风险及规避措施。11 大数据中心组织架构设计借鉴国内外大型企业大数据中99、心组织设计经验,规划重庆轨道交通大数据中心组织架构图如下: 大数据中心总经理:全面负责大数据中心工作并向集团分管副总经理汇报。 大数据中心副总经理:协助总经理分管部门工作。 规划建设部:l 部长:全面负责部门工作并向大数据中心总经理、副总经理汇报工作;l 系统规划岗:负责大数据中心总体架构的规划设计及未来技术演进等;l 应用规划:结合企业实际业务需求及相应数据数据,负责大数据中心应用规划的设计;l 项目管理岗:组织协调相关厂商、集成商,负责大数据中心项目建设的进度把控、实施保障等项目管理工作; 运营分析部:l 部长:全面负责部门工作并向大数据中心总经理、副总经理汇报工作;l 运营分析岗:针对企100、业各级领导、相关业务部门、外部单位提供必要的基础业务运营分析支撑服务,如日常报表、临时需求、批量数据服务等;l 数据分析岗:基于大数据中心进行深度数据探索和相关专题分析工作,为企业中高级决策人员及上级单位提供专业数据分析报告。l 需求分析岗:负责对接内外部业务用户,对业务需求进行分析,并将可以满足的数据分析需求传递给相关运营分析、数据分析人员,短期无法满足的分析需求需传递给应用规划人员做下一步安排。 系统运维部:l 部长:全面负责部门工作并向大数据中心总经理、副总经理汇报工作;l 数据运维岗:负责数据管控及数据治理工作,包括数据标准管理、数据模型管理、元数据管理、数据质量管理等;l 系统运维岗101、:负责大数据中心相关软硬件设施的IT基础管理,保障整个系统的高效可用。12 大数据中心第一阶段投资预算评估13 大数据中心第二阶段投资预算评估14 机房环境要求14.1 第一阶段机房环境要求 数据仓库一体机:l 高 205cm ; 宽 61cm ; 深 126cm ; 重量 600KG。l 功耗:4500W; 输入电源类型:380V 32A三相。 42U标准机柜(内含服务器、路由器、交换机):l 高 200cm ; 宽 600cm ; 深 100cm ; 重量 700KG。l 功耗:8000W。 温度:18度 - 27度 湿度:30 - 6014.2 第二阶段机房环境要求14.2.1 主中心 102、数据仓库一体机:l 高 205cm ; 宽 61cm ; 深 126cm ; 重量 825KG。l 功耗:7500W; 输入电源类型:380V 32A三相。 42U标准机柜一(内含服务器、路由器、交换机、防火墙):l 高 200cm ; 宽 600cm ; 深 100cm ; 重量 700KG。l 功耗:8000W。 42U标准机柜二(内含服务器、路由器、交换机、磁盘阵列、SAN交换机):l 高 200cm ; 宽 600cm ; 深 100cm ; 重量 700KG。l 功耗:8000W。 磁带库l 高 27cm ; 宽 45cm ; 深 80cm ; 重量 60KG。l 功耗:500W。 要求温度:18度 - 27度 要求湿度:30 - 6014.2.2 备中心 数据仓库一体机:l 高 205cm ; 宽 61cm ; 深 126cm ; 重量 720KG。l 功耗:5000W; 输入电源类型:380V 32A三相。 42U标准机柜一(内含服务器、路由器、交换机、防火墙):l 高 200cm ; 宽 600cm ; 深 100cm ; 重量 400KG。l 功耗:4000W。 要求温度:18度 - 27度 要求湿度:30 - 60第 71 页