申报稿数据中心一卡通系统建设方案可行性研究报告word.doc
下载文档
上传人:地**
编号:1238458
2024-10-18
89页
1.46MB
1、一卡通系统数据中心平台建设方案可行性研究报告中国船舶重工集团公司第七一六研究所二一二年一月目 录第1章、总论11.1概述11.2建设背景11.3建设必要性和可行性21.4建设目标与任务5第2章、需求分析72.1用户需求72.2数据需求72.3系统及应用需求分析102.3.1节点管理122.3.2主题管理122.3.3元数据管理122.3.4公共代码管理132.3.5数据采集132.3.6数据整理比对132.3.7数据交换132.3.8数据访问142.3.9数据备份与恢复142.3.10标准管理142.3.11应用支持142.3.12运行管理142.4性能需求分析152.4.1业务处理量分析152、2.5安全及保障机制需求分析162.5.1系统安全可靠性需求162.5.2数据安全保密性需求172.5.3数据完整性需求172.5.4实体的可鉴别性需求172.5.5不可否认性需求172.5.6对象和行为的可授权性需求182.5.7统一信任与授权策略需求182.5.8数据中心统一安全监管性需求182.5.9保障机制需求分析19第3章、数据中心设计方案203.1设计原则203.1.1统一建设203.1.2相对独立203.1.3共建共享203.1.4安全可靠213.2数据中心平台设计213.2.1平台总体架构213.2.2数据资源规划213.2.2.1数据资源规划的总体思路223.2.2.2数据资3、源体系结构233.2.2.3共享数据一致性的保证243.2.2.4共享数据库的建立过程253.2.3数据支撑平台263.2.3.1数据共享交换子系统263.2.3.2目录管理服务子系统303.2.3.3共享数据管理子系统313.2.3.4共享业务管理子系统313.2.3.5系统配置管理子系统323.2.3.6系统安全管理子系统323.2.4数据共享交换平台333.2.4.1交换网络结构333.2.4.2交换概念模型343.2.4.3交换体系结构363.2.5共享数据管理系统373.2.5.1功能设计383.2.5.2逻辑结构393.2.6数据接口系统403.2.7服务器系统设计413.2.7.4、1设计原则413.2.7.2服务器系统选择的依据423.2.7.3需求分析433.2.7.4性能测算443.2.8存储系统设计453.2.8.1设计原则453.2.8.2主流存储技术比较及建议453.2.8.3Raid类型配置建议483.2.9灾备系统设计493.2.9.1设计原则493.2.9.2灾备技术比较503.2.9.3灾备解决方案523.2.9.4备份策略533.2.10网络系统设计533.2.10.1设计原则533.2.11安全保障体系543.2.11.1物理安全553.2.11.2网络安全553.2.11.3系统安全563.2.11.4应用程序安全573.2.11.5数据安全575、3.2.11.5.1核心数据加密583.2.11.5.2数据访问控制583.2.11.5.3数据传播和复制593.2.11.6整体安全策略的说明593.2.12数据中心典型应用603.2.12.1数据交换平台603.2.12.1.1运行模型603.2.12.1.2信息共享交换613.2.12.1.3共享目录检索613.2.12.1.4共享数据查询服务体系623.2.12.1.5业务数据整理633.2.12.1.6决策支持系统63第4章、运营及保障机制654.1运营机制654.2运行管理机制654.3信息资源管理机制654.4运行管理制度66第5章、连云港市市民卡数据中心运行平台硬件设备配置方案6、685.1建设背景685.2设计原则685.3应用描述695.4市民卡软件系统总体架构图705.5系统软件平台功能设计705.6市民卡数据中心运行平台设计725.7项目需求分析725.8市民卡数据中心总体拓扑735.9网络系统745.10主机系统755.11存储系统765.12双机热备系统785.13数据备份系统795.14运维系统805.15网络安全系统815.16漏洞扫描系统815.17数据灾备系统82vi第1章、 总论1.1 概述连云港市市民一卡通系统的建设已经成为今后一个时期我市信息化工作的重点,政府牵头、银企联合带动国民经济和社会发展信息化,实施信息化带动工业化的发展战略。市民卡数据7、中心成为卡运营公司、银行、大量运输企业、公用事业、零售商户关联交易业务的承载平台,不再是单一部门的业务承载网,市民卡数据中心正逐步在演变为一个跨系统、跨部门的平台。连云港市市民一卡通系统数据中心(以下简称“数据中心”)的建设是为了解决各单位间信息共享,实现业务部门之间的数据交换与数据共享,促进市民卡电子支付的发展。1.2 建设背景“市民卡”是指由一个城市的政府机构发放给市民用于办理各项个人相关社会事务和享受公共服务多功能、多用途的智能卡。在城市信息化发展的今天,“市民卡”将采用IC集成电路形式作为卡的载体具有信息存储、身份识别、电子凭证、信息查询和电子钱包等基本功能。“市民卡”具备以下几大功能8、:(一)、“市民卡”是面向于广大市民,为市民提供各种应用类服务的IC集成电路卡:其中应具备水电煤、有线、电话等各项缴费功能;具备市民日常生活消费的小额支付功能;具备各项缴费、消费支付信息查询功能;具备市民公共交通支付功能等市民日常生活必需的应用。(二)、“市民卡”是政府为市民提供服务和信息交流的用卡,是劳动保障、公安、民政、教育、卫生、交通、市政、文化等各相关服务部门为市民提供社会服务的载体。(三)、“市民卡”是社会服务与企业服务相关需求的用卡,实现工商年检、查询、个私报税、单位车辆加油等增值功能。1.3 建设必要性和可行性城市建设“市民卡”项目和可持续发展所必备的条件包括以下几个方面:(一)9、经济条件:符合“市民卡”建设的城市必须有良好的经济基础,从现有国内城市分析,适于建设“市民卡”项目并具备相应经济条件的城市需符合以下几个特征:1)人均可支配收入,“市民卡”在基本应用规划中把小额支付的电子钱包功能作为基本应用,城市居民人均可支配收入的高低直接影响到消费的支付能力和消费欲望。城镇居民人均可支配收入达到12000元以上,并且能保持稳定的增长。2)“市民卡”实施城市的国民生产总值,GDP 代表一个城市工业、服务业及其他产业的发展,也代表城市的综合竞争实力和发展前景,人均国民生产总值能达到4000美元以上,并能保持长远的增长。3)城市消费品零售总额,一个城市经济的活力同时也要表现为消10、费品的零售总额以及餐饮消费所占消费零售总额的比重,城市居民消费性支付在5000元以上,随着人均可支配收入的增加以及城市经济的发展,零售消费支出也将逐步上升。4)、恩格尔系数,恩格尔系数一直是衡量城市人民生活状况的晴雨表,恩格尔系数达到40%以下的城市经济消费结构合理,并且城市居民较为富裕,有足够的资金用于除食物外的其他消费中。5)、经济前景,受国家经济高速发展的宏观影响,各城市经济发展总是在稳步前进,但是依托经济发展必须要有良好的环境,其中包括交通、住房、城市环境、外商投资、产业链等各方面影响着城市的经济发展速度。中国经济景气监测中心等共同发布的中国综合实力百强城市显示,在经济发展和综合实力方11、面排名在前30名具备发展城市”市民卡”的经济条件。城市的综合消费水平以及经济环境的提升为城市“市民卡”的应用以及消费潜力的挖掘铺垫了基础。(二)、应用环境:“市民卡”应用环境从以下几个方面进行分析:1)在城市交通系统中的应用,公共交通作为城市交通枢纽的主干,拥有非常庞大的使用群体,目前很多城市的公共交通都已实施了IC卡标准进行了无人售票制,不但减少了公共交通系统的运营成本而且方便了乘客使用。公共交通的IC卡应用成为最具有人气、日均刷卡率最高的智能卡项目。一个城市上“市民卡”项目在前期的关键还在于该城市公共交通IC卡应用的普及情况和整合公交的IC卡资源;2)在金融支付方面的应用,目前各大银行都发12、行了大量的贷记/借记银行卡在发卡量较多的城市几乎已经做到了平均人手一卡,无论是商场购物还是代发职工工资、银行按揭、代缴水电费、学生缴付学杂费等基本都应用了银行卡业务,并且在当地银联的统一协调下在各消费行业投放了大量的刷卡POS系统做到持卡人在方圆1500米范围内可以通过ATM或者自助银行取款圈存,并做到刷卡POS 无盲区为金融卡的广泛使用铺垫了基础。3)、社会医疗保险已覆盖城市各大医院和药房。从以上几组分析可以看出城市在实施“市民卡”项目时必须具备的用卡环境。用卡环境需要多方面的倡导。1、发卡单位的优惠政策 2、针对持卡人刷卡消费的奖励计划 3、遍布各街区和社区的充值网点 4、无盲点的用卡场所13、 5、卡片增值应用功能的增加 6、政府的政策性引导 7、当地的消费景气指数等(三)、政府支持力度:建设数字化城市是“市民卡”工程项目的远期目标,IC卡作为信息的载体和接口,在“市民卡”工程项目中,通过向市民发行用于城市生活的IC卡,建立城市公共事业管理信息平台。将市民的生活信息和消费信息,通过使用IC卡进行数字化记录,反映到城市的相关的信息系统中,为城市信息的综合管理提供必要的数据与分析。有了这些信息,辅以其他手段,如:查询、统计,间接测算、决策分析等,为城市中的个人消费、企业经营及城市管理者的决策,提供了多方面有力的分析基础和指导依据。根据国家城市信息化建设的战略方针,以及各城市实现“数字城14、市”发展规划的纲要,以坚持“统筹规划、分步实施、重点突出、注重实绩、统一标准、开放互通、政府推动、市场运作,多方共建、利益共享为原则,以需求为导向,以便民服务为基本出发点,以系统安全可靠为前提,有步骤、分阶段地推进“市民卡”项目建设,提高城市综合管理能力和社会公共服务水平。“市民卡”项目的建设和应用离不开政府对该项目的支持和协调。为此,各城市实施“市民卡”工程,必须由市政府主要领导挂帅成立相应的领导协调机构。“市民卡”是将多种功能集于一身,是利民益民之举。对政府部门来说,多卡合一也便于各部门之间的信息共享和资源整合。“市民卡”项目是一项政府为民办实事的工程,也是一项民心工程,实施“市民卡”项目15、就是要方便老百姓日常生活,实现“多卡变一卡、一卡多用”的目的。(四)、卡资源情况:目前各城市发行的卡分为公共服务的卡如1)、社保/医保卡、公交卡2)、金融业务方面的磁条卡 3)、电信业务卡 4)、各商户发的卡如咖啡馆、洗衣店等。在经济条件较好的城市差不多全大市人均会有1张卡,在金融卡领域可实现取现、消费和转账等各种金融功能,也通过银联实现了各家商业银行的卡片互通和机具共享。在各行业发卡量多的城市,无论是衣食住行,还是消费购物,或者日常的生活开支均可使用各种金融卡以及消费卡或者是公共服务卡,大量的卡发行培养了市民用卡的习惯,为“市民卡”的推出奠定了环境基础。市民卡数据中心承载大量的与资金相关的并16、关系众多市民的业务应用,其建设的可行性与必要性在现今市民卡的使用背景现状和信息技术发展的实际条件下是完全必要且可行的。1.4 建设目标与任务数据中心的建设是为了解决联网部门间信息共享,实现业务部门之间的数据交换与数据共享,促进市民卡业务的发展。具体目标如下:建立数据中心的系统平台。完成相应的应用软件和数据管理系统建设,实现数据的交换、保存、更新、共享、备份、分发和存证等功能,并扩展容灾、备份、挖掘、分析等功能。(一)建立数据中心的系统平台。完成相应的应用软件和数据管理系统建设,实现社会保障数据的交换、保存、更新、共享、备份、分发和存证等功能,并扩展容灾、备份、挖掘、分析等功能。(二)建立全市公17、共信息库等共享数据库,为宏观决策提供数据支持。对基础数据进行集中管理,保证基础数据的一致性、准确性和完整性,为各业务部门提供基础数据支持;(三)建立数据交换共享和更新维护机制。实现各业务部门之间的数据交换与共享,以及基础数据的标准化、一致化,保证相关数据的及时更新和安全管理,方便业务部门开展工作;(四)建立数据共享和交换技术标准和相关管理规范,实现各部门业务应用系统的规范建设和业务协同;(五)为公共服务中心提供数据服务支持,实现面向社会公众的一站式服务;(六)根据统计数据标准汇集各业务部门的原始个案或统计数据,根据决策支持的需要,整理相关数据,并提供统计分析功能,为领导决策提供数据支持;(七)18、为监督部门提供必要的数据通道,方便实现对业务部门以及业务对象的监管,逐步实现有效的业务监管支持;(八)为业务数据库的备份提供存储和备份手段支持,提高业务应用系统的可靠性。第2章、 需求分析2.1 用户需求从与数据中心交互的组织机构、人员方面进行说明。与数据中心交互的单位机构各业务部门通过接口系统向数据中心提供数据或使用数据中心提供的数据;业务部门之间可直接交换数据。各业务系统单位遵循标准规范进行业务系统建设和改造,实现业务系统与数据中心的对接。与数据中心交互的人员数据中心系统管理员负责数据中心系统管理、监控、系统维护数据中心数据管理员负责数据的整理、比对、数据一致性的保证业务部门数据管理员一般19、与同级数据中心数据管理员协同工作2.2 数据需求连云港市市民卡数据中心必须满足进行数据交换的需要,同时还必须满足在平台上建立的各业务系统进行综合业务处理的要求。为门户系统提供各种静态和动态的数据、信息。所谓静态信息是指对运行中不经常变化,供各个业务系统查询、处理的数据或信息:政策、法规、元数据、资料库、各种多媒体数据等,它们会随着时间而逐步增大。所谓动态数据是指随着运行而增加、修改的数据:流转状态数据,反映企业、个人所处状态的数据等。因此,数据中心的建设,首先要解决数据库异构信息类型的分类存储和检索体系以及针对不同类型数据模型的设计这一基本问题。另一方面,数据中心管理着大量的结构化和非结构化信20、息。所谓非结构化信息,是相对于那些有清晰的结构和类型定义以及有数据相关性的明确描述的信息类型而言的。比如,在财税分析系统中,财政收支情况的月度数据,可以理解为一种有清晰结构的信息;而一份综合性包含了文字、报表、分析图形的财政收支分析报告则是一种非结构化的信息。网站上发布的信息,如新闻动态、公开等等,一般也是非结构化的信息。此外,非结构化信息中还包括了一类对象数据信息。所谓对象数据信息,是指一个包含了内敛结构的专门数据块,这个数据块单独无法建立与别的数据项的关联关系,并且需要工作在特定的工作模块下。比如:GIS空间定义信息数据、多媒体的声像数据等,均为对象类型的数据。在决策应用中,非结构化信息将21、占到相当的比例。文件均属于非结构化信息,政策法规属于非结构化信息,一些决策分析的综合性资料也是非结构化信息。与结构化信息相比,非结构化信息的管理利用存在一些难点,就是:(1)定义管理的难度“非结构”化表明了没有一种象关系数据库规范那样的定义模型来对非结构化信息进行定义管理。虽然你可以强制对一个非结构化的信息块进行解构,将其分成类似头、中、尾这样的半结构。但是这种结构只有在制定了具有普遍含义的结构描述定义后才有真正的意义。对非结构化信息进行定义管理的另一个难点在于数据元类型无法穷举。不象关系型数据系统中,对数据元类型有完整清晰的定义。在非结构化信息中,包含了错综复杂的数据元类型。比如,仅文档类型22、就包括Text、Word、PDF、Excel、Word Pro等等,还有各种图片文件格式、多媒体压缩信息格式等等。此外,在象网页这样的非结构化信息中,所有的信息都是文字类型,设定时间、数字等类型的信息元并不具有运算上的意义。(2)存储管理的难度对信息进行存储管理的前提是能够建立有效的数据定义,然后才能进行非结构化信息的组织存放。而前面已经提到了在非结构化信息的数据定义方面存在的难度,因此也就造成了在非结构化信息存储管理方面的困难。当然,对非结构化信息最简单的存储方式是直接存放在文件系统中。这样做避免了依据主题等分类因素对非结构化信息进行管理的问题,但也是最最低效的一种存储管理方式。在非结构化信23、息的存储管理中还涉及到一个问题,由于这些信息元(如果对非结构化信息进行一定的半结构化处理后)的数据可能来自关系型数据系统(比如Oracle)、对象数据系统(多媒体数据或空间数据)乃至文档数据系统(比如Notes),所以一个非结构化信息的存储管理系统将充当一个数据的汇整者,需要具备联合各个外部数据系统的功能。缺乏对非结构化信息的有效管理造成的直接结果就是无法对非结构化信息进行有效检索。(3)信息检索的难度由于不能像关系数据库那样建立起清晰定义的数据主题,非结构化信息的检索依照的只能是机械的全文内容检索。这是对信息检索非常不利的一点。虽然对信息内容的全文检索可以做到资料检索的遍历,但其检索的效率和24、命中率是很低的。由于不象关系数据库那样有一种象SQL(结构化查询语言)那样强大的关联检索工具,并且在定义数据时也没有建立数据项之间的关联关系,要具有针对性地查询非结构化信息的内容,必须要依靠应用程序中设置对特定非结构化信息类型进行专门处理的功能内容,才可能提高信息检索的强度和效率。但另一方面讲,一种专用于理解特定非结构化信息类型的处理模块,无论在运行效率还是在可维护性上,都是非常不现实的。非结构化信息检索的另一个难度也是与数据元类型的多样性有关的。比如,不同的文档类型结构需要不同的全文索引工作模块。这也无形中加大了对非结构化信息进行检索的难度。因此,数据中心的建设,还必须从技术体系上解决如何对25、非结构化信息进行有效定义、有效管理和有效利用的基本问题。2.3 系统及应用需求分析数据中心的主要业务包括: 从基层或业务部门采集数据,包括基础数据和部分共享业务数据,支持基础和共享数据的更新维护模式; 对采集到的数据进行校验和比对,发现冲突时按照共同制订的数据处理规范进行处理,保证数据的一致性和准确性; 受理业务部门或基层单位的基础数据使用申请; 将整理后的基础数据分发或按需提供给有关部门或单位使用; 以中介的方式处理共享业务数据使用申请,并进行备案; 对共享业务数据在征得业务部门同意的情况,通过数据中心进行存储转发; 将共享元数据的信息发布给各业务部门,提供浏览与订阅申请,方便其共享必要信息26、; 提供数据交换平台和接口系统,使数据中心与各部门的数据管理员可以对共享和交换过程进行管理; 通过数据交换平台存储和管理公共服务数据,并与外网同步,提供一站式服务; 存储和管理统计数据,根据决策支持的需要,整理相关数据,并提供统计分析功能,对数据进行统计和分析,方便领导及时掌握有关情况。 定期对业务数据库进行容灾备份; 与此相对应,业务部门与数据中心发生的相关业务包括: 提供数据或共享元数据给数据中心; 申请使用数据中心的基础数据,校准本单位的基础数据; 通过数据中心提供的共享元数据信息获取其他单位的数据; 审批其他单位的业务数据使用申请,并将数据提供出去; 与数据中心交换公共服务数据; 提供27、监督部门直接访问业务数据库的通道; 提供统计分析数据或原始个案给数据中心,方便主管领导查询; 定期将业务数据库备份到数据中心;根据数据中心与各业务部门的主要业务,数据中心应提供如下功能:2.3.1 节点管理实现与数据中心相连的各个节点的信息管理、配置管理,包括业务部门数据中心等。2.3.2 主题管理数据采集、数据发布、数据共享、数据交换、公共服务以及决策支持均以主题的方式进行,因此必须实现对主题的管理。主题是元数据的集合。2.3.3 元数据管理元数据是关于数据的数据。元数据描述了数据的结构和意义,同时也可以描述应用程序和流程的结构和意义。构造数据中心数据库的重要步骤之一,就是定义和创建元数据(28、Metadata)。元数据提供一个目录,列出数据中心有什么数据。所有进入数据中心的数据,必须在元数据中有所表述。数据中心的数据管理系统必须提供储存和管理元数据的方法。以元数据管理为核心,建立数据中心的数据资源目录体系,提供给业务部门参考使用。数据中心的元数据包括基础数据元和共享数据元,由数据中心统一管理。基础数据元由数据中心定义,共享数据元由业务部门定义并注册到数据中心。业务部门进入数据中心的元数据管理中心好比进了一个“超市”,可以方便地知道可以获取和使用哪些数据,并进行数据使用申请的定制。2.3.4 公共代码管理对公共代码需要有统一的标准规范,数据中心必须提供公共代码的管理。基于数据中心的公29、共代码规范,各部门数据中心可以通过数据转换将各种不同含义的编码和标准规范的编码之间进行双向的转换。2.3.5 数据采集与各业务部门形成数据采集机制,通过数据共享交换平台从各业务部门汇总数据,对原始数据进行缓存、存储。2.3.6 数据整理比对从各业务部门采集共享数据后,进行数据转换,对全市自然人和法人基本数据进行数据比对、冲突检测处理并入库。2.3.7 数据交换实现业务部门与数据中心之间以及业务部门之间的数据交换业务,形成高效、安全、可靠、稳定的数据交换网络。提供定时批量、实时按需的数据交换,提供点对点、一对多的数据交换支持,对数据交换进行管理和监控。2.3.8 数据访问在统一的权限管理系统之上30、,实现对自然人和法人的建档、调档、阅档等业务。对社保卡系统、公共服务中心系统、业务系统提供数据访问。对决策支持系统、业务监管提供数据支持。2.3.9 数据备份与恢复恢复管理是对数据进行备份、导入导出以及数据库恢复等。数据是数据中心核心的资源。全面的容灾方式应该是数据备份+数据复制+远程容灾。对系统中的数据要定期进行系统备份。采用本地备份与异地备份相结合的方式。2.3.10 标准管理进行数据中心的标准规范尤其是数据标准的审核制定、升级维护与发布实施等管理功能。在数据中心的建立之初,由于标准规范处于不断完善的过程,应建立标准的版本管理机制,方便业务部门的查询和使用。2.3.11 应用支持对相关业务31、应用系统、公共服务系统、业务监管系统和决策支持系统提供提供数据、通道和平台等支持。2.3.12 运行管理为方便对数据中心的管理和维护,需要一套功能完整的运行管理与监控维护系统。运行管理系统主要提供给数据中心的系统管理人员使用,用于保证数据中心的安全可靠和高效运行。其功能主要包括面向安全性的用户管理、权限管理、密码管理和日志管理等;面向性能优化的性能监控等。面向可用性的节点管理、交换规则管理和状态监控;其中节点管理包括对业务部门的信息管理。2.4 性能需求分析2.4.1 业务处理量分析数据中心的主要业务包括:(1)基础数据的采集、转换、比对以及分发这是数据中心的主要负载压力所在。(2)业务数据交32、换的备案或存储转发在数据中心建设初期,业务数据在业务部门之间交换;当业务部门的接口系统难以承受数据交换的负载时,才可能通过数据中心存储转发。所以这部分业务不会对负载造成负载压力。(3)元数据库和公共代码库的管理和共享由于元数据库和公共代码库相对稳定,并且数据量不是很大,所以不会对数据中心造成负载压力。(4)与业务部门交换公共服务数据由于业务不停地在发生,即使采用定时批量的交换方式,也会对数据中心造成较大的负载压力。(5)汇集统计数据,并提供查询统计数据一般按月提供,而且提交的一般为结果数据,在数据交换方面不会构成太大压力。领导的数据查询会形成少量的负载。(6)提供业务部门的容灾备份容灾备份不需33、通过数据库服务器处理,所以不会对数据中心的负载构成压力。数据中心的主要负载压力在于两个方面,一是基础数据的采集、维护和使用;二是数据中心与业务部门之间的公共服务数据交换。下面我们分别进行分析。基础数据的变动将引起数据中心的负载。首先业务部门需将变动数据交换给数据中心,数据中心采集后进行转换和比对,然后进行发布,分发给有需要的部门使用。数据中心提供对公共服务系统的支持。各业务部门的公共服务业务数据通过统一的数据共享与交换平台即时或定时的交换到数据中心,保存到公共服务数据库。2.5 安全及保障机制需求分析2.5.1 系统安全可靠性需求数据中心如果遇到破坏,或无法正常工作,将造成无法估量的损失。需要34、保护的资源不仅有物理资源(设备、设施)、数据资源(数据、数据库软件等),而且还有网络资源(通信链路、网络接入等)。2.5.2 数据安全保密性需求满足在数据存储、传输过程中的安全保密性需求。市民卡系统中涉及大量的敏感数据,在其处理过程中,特别是与各级单位数据交换过程中,要进行数据加密传输和存储,要保证数据的安全保密性。2.5.3 数据完整性需求满足在数据存储、传输过程中的完整性需求。在内部要保证数据存储和传输过程中不被篡改和破坏;在与各级单位数据传输的过程中,要保证数据不被篡改和破坏。2.5.4 实体的可鉴别性需求满足数据中心系统对用户及数据交换服务器的可鉴别性需求。系统要实现监管及其他方面的需35、求,其必要条件是实现实体的可鉴别性,包括用户及数据交换服务器具有可鉴别性等。2.5.5 不可否认性需求满足数据中心用户行为和系统行为不可抵赖性的需求。用户每天都利用数据中心处理大量的事务,事务处理过程的可管理、效率的可审计、行为的可审计等,需要行为的不可抵赖性来解决,本项目建设中要保证在所有数据处理过程中,办公人员行为和系统行为的不可抵赖,以便审计和监督。2.5.6 对象和行为的可授权性需求实现对数据资源的自主授权和访问控制的功能。针对数据交换共享工作的特点,要求数据中心具有对对象灵活授权的功能,包括用户对用户的授权、系统对用户的授权、系统对系统的授权等,以及授权过程的审计监督。2.5.7 统36、一信任与授权策略需求对于涉及十多个业务部门、若干业务系统的数据中心而言,安全性的实现不仅体现在各个部门、各个业务系统中,更重要的是在不同业务部门的不同系统实现互联后,如何保障数据、业务系统在互通后的信任、授权的一致性,因此在大社保系统中,必须建立统一的信任策略、授权策略,实现跨部门、跨系统的信任和授权服务的一致性,杜绝由于不同部门、不同业务系统不同的安全策略、不同的安全等级带来的安全漏洞和安全隐患。2.5.8 数据中心统一安全监管性需求由于数据中心涉及多个部门,因此需要实现数据交换、共享过程的可管理,实现对内部和对各级单位相关的业务处理的可审计性;系统中有大量的数据交换服务器、维护终端、系统软37、件、网络设备等,为使这些资源协同工作,需要实现对实体(用户或数据交换服务器)进行统一的管理;系统需要对用户行为和系统行为进行记录和统计,对系统日志进行分析和统计,提供对用户和系统行为的审计监督。这种统一的安全监管必须以可靠的技术和严格的管理来保证。2.5.9 保障机制需求分析(一)制定连云港市市民卡系统数据资源目录管理办法,重点说明数据资源目录体系和运行模式,明确提供方、使用方和管理方的职责分工。提供方负责数据资源目录中本部门数据资源的编目、注册、维护等;管理方负责数据资源目录的审核、发布和管理,并负责数据资源目录管理服务系统的日常运行维护;使用方负责对获取的数据资源在授权范围内合法使用。(二38、)制定连云港市市民卡数据中心实施指南,重点说明指导管理人员如何通过数据资源目录管理服务系统开展日常业务和管理服务工作,以及指导部门通过数据中心系统建立和更新维护数据资源目录等。(三)要结合本市特点和实际情况制订相关机制。第3章、 数据中心设计方案3.1 设计原则3.1.1 统一建设数据中心必须统一规范建设。通过制定统一的数据交换与共享标准,建设统一的数据共享与交换平台和统一的接口系统,可以避免重复投资,降低接口的复杂性,有效实现数据中心与业务部门以及业务部门之间的数据共享与数据交换,消除“信息孤岛”,实现数据资源的互联互通。3.1.2 相对独立根据数据中心的功能定位,数据中心的建设和运作必须保39、持业务系统的相对独立性。为此采用松散耦合方式,通过在业务部门统一配置接口系统实现数据资源整合。3.1.3 共建共享一方面建设数据中心的目的是为了实现业务部门之间的数据共享。另一方面,数据中心的数据来源于各个业务部门,因此数据中心的建设必须依靠各业务部门的积极参与和配合。3.1.4 安全可靠数据中心的安全是非常重要必须要做好系统的安全设计,防范各种安全风险,确保数据中心能够安全可靠的运行。同时数据中心必须采用成熟的技术和体系结构,采用高质量的产品,并且要具有一定的冗灾功能。3.2 数据中心平台设计3.2.1 平台总体架构3.2.2 数据资源规划数据资源是数据中心最重要的资源。数据中心的数据资源分40、布状态具有阶段性,每个阶段都对应数据资源整合的不同阶段,体现数据资源的管理集中、有机分布的特点。根据“基于数据,围绕数据,面向数据”的建设思路,我们进行数据资源体系的总体规划,然后具体描述共享型的共享数据库、操作型的业务数据库和分析型的历史数据库这三类数据资源的构建、维护和使用。3.2.2.1 数据资源规划的总体思路数据资源规划的总体思路主要包括如下几个方面: 数据共享标准化首先共享数据是标准的,其次共享的方法和途径是规范的。目前各系统数据资源数据库已经有多种存在方式,要解决系统间信息的互连、互通、互操作,必须针对共享数据建立共同遵守的标准规范,只有编码是统一的、格式是统一的、数据交换的方式是41、统一的,才能保证数据是一致的,才能实现对数据交换和数据共享的有效管理。 业务数据相对独立各职能部门分管业务的范围和职责不同。因此,系统在全局考虑、统一设计的同时,还要充分考虑不同业务部门自身的特点,在统一规划的前提下,保证支持不同业务活动的数据具有相对独立性,建立面向各部门进行联机事务处理的业务数据库。 决策数据集成化建设数据中心的另一个目的就是将各部门的业务结果数据有机地集成在一起,进行综合查询和统计分析,为各级领导的决策提供有力的数据支持。3.2.2.2 数据资源体系结构数据中心数据资源体系结构对公共服务系统、业务应用、决策分析提供支持,数据中心的数据库包含如下内容: 共享数据库,包含:自42、然人基础数据、法人基础数据库、元数据库、标准代码库、共享业务数据(如果业务部门之间通过数据中心进行数据交换)。 统计分析数据库,汇集各业务部门的统计分析数据,为决策提供数据支持。 运行管理数据库,用于监控管理、节点管理、日志等。 公共服务数据库,提供对公共服务系统的数据支持。3.2.2.3 共享数据一致性的保证共享数据包括自然人和法人基础数据及其元数据和标准代码数据、共享业务数据。共享数据一致性问题是数据中心面临的关键问题。从范围上划分,共享数据包括基础数据,基础数据包含基准数据。l 基准数据基准数据是指唯一表示自然人和法人的数据字段集合,自然人有身份证号码和姓名标识,法人有法人机构代码和名称43、标识。基准数据主要来源是市公安局和市质监局。基准数据必须保证在整个社会保障信息系统是一致的,将来扩展到整个电子系统是一致的。市公安局和市质监局负责将更新的信息交换到数据中心;市数据中心负责汇总数据,进行比对整理校验,形成一致的基准数据,通过数据共享与交换平台分发给各业务部门;由业务部门校验更新自身的基准数据,保证基准数据的一致性。基础更新频度要达到每天更新甚至实时更新。数据的传递和分发通过数据交换平台实现。l 基础数据基础数据是指自然人和法人的常用基本信息,各业务部门日常管理都需要用到的面向主题的数据。基础数据包括自然人和法人的基准数据和其他元数据。主要来源是业务部门。基础数据一致性必须建立于44、基准数据一致性的基础上。基础数据的一致性也需要通过数据共享与交换平台和相应的机制、管理办法来保证。各部门按照业务职能明确元数据维护责任和权限,定期将在办理业务过程中更新的元数据项数据提供给数据中心;数据中心根据基准数据一致性的原则,对各业务部门提供的数据进行比对校验,正确的数据增加或更新到数据库中,并每天按照各业务部门业务要求,将更新数据分发到各业务信息系统;各业务部门可以直接使用这部分数据作为支撑业务和管理的数据资源,也可以作为业务参考信息。基础数据的范围将随着元数据范围的扩大而扩大。这部分数据同时可作为社保卡的数据。基础数据更新的频度,按照元数据使用的频度分别定义,通过部门协商机制研究确定45、,最低要求每周更新,一般每天更新,业务关联度较高的信息,要实现实时更新。数据的传递和分发通过数据交换平台实现。l 元数据标准和标准代码数据元数据标准和标准代码数据由数据中心维护更新,并发布给各业务部门使用,由于业务部门系统内部沿用的代码可能与数据中心的发布版本不一致,业务部门需保证与其他业务部门进行共享交换的数据必须遵循数据中心的标准规范,而在系统内部可以采取逐步过渡迁移的方案,尽量减少影响业务运作。l 共享业务数据共享业务数据是指多个业务部门之间需要共享使用的数据,作为各业务部门进行管理的参考数据。数据来源渠道包括业务部门、社会保障卡和公共服务等业务运营机构。共享业务数据以业务数据的发生地管46、理部门为准。这类数据由各业务部门按业务需求和协商的频度提供给数据中心,在数据中心处提供各部门查询。由于这类数据量比较大,预计可以分业务、分批更新。3.2.2.4 共享数据库的建立过程共享数据库的建立采取逐步扩展的策略,达到数据整体上的一致性、完整性和准确性是一个逐步完善的渐进式递归过程。共享数据库的建立由业务驱动,业务部门提供的自然人、法人基础数据经数据源单位确认后存入基准数据库,并反馈业务部门,经过不断的提交和确认,基准数据库的数据不断增加,覆盖范围不断扩大,比对的工作量逐步减少。在基准数据库的基础上,不断补充其他的自然人、法人基础信息,最终形成自然人、法人共享数据库。采取围绕自然人和法人基47、准数据为核心,在核心的基础上不断扩充和完善自然人和法人共享数据的策略进行建设。首先建立和整理自然人和法人基准数据库,保证核心的准确性,为各业务部门进行数据清洗和整理提供基础;再在基准库的基础上搭建自然人和法人共享数据库的整体框架,共享的信息内容成熟一个、整合一个、交换一个。3.2.3 数据支撑平台连云港市市民卡数据中心支撑平台主要包括:数据共享交换子系统、目录管理服务子系统、共享数据管理子系统、共享业务管理子系统、系统配置管理子系统和系统安全管理子系统。3.2.3.1 数据共享交换子系统数据共享交换子系统为全市各业务部门提供数据交换服务。主要功能包括:(1)交换管理提供交换节点、交换服务和交换48、桥接的配置、调度和检测功能;提供交换服务和交换桥接的日志查询和统计功能。(2)交换服务提供共享域内交换节点之间的数据共享交换服务,包括采集、分发、汇总和转发;提供交换节点与业务系统之间的交换桥接服务,实现数据提供和获取;提供跨域交换服务,实现共享域之间通过对接节点进行数据交换。数据交换引擎是数据共享交换平台的核心。数据交换引擎主要包括服务处理和数据接口。(一)服务处理数据交换引擎运行过程示意图如下:图表 1数据交换引擎运行示意图数据交换引擎接负责收并处理数据交换服务请求,实现数据的交换。主要包括:(1)服务请求监听器服务请求监听器采用监听机制,实现对服务请求的并发接收。(2)服务解释处理器服务49、解释处理器负责解释执行服务请求。服务请求监听器把服务请求转发到解释处理器,服务解释处理器查询所请求的服务定义,根据服务定义产生执行序列并控制各个交换节点实现交换服务。在数据交换压力大的时候,根据服务的优先级高低,控制交换服务的执行顺序,确保高优先级的服务优先执行。(3)服务定义服务定义记录了服务的项选参数以及设置,描述了服务应该如何解释和执行。交换服务可以定义服务优先级等信息。(4)接口控制接口控制负责把命令序列发送到各个交换节点,控制交换节点上的数据接口,驱动数据交换的执行。(5)传输管道数据的交换过程是在传输管道中进行的,传输过程分为三部分,数据输出,网络传输、数据输入。在源节点的数据输出50、接口把数据由数据源读出,并根据服务配置经过数据加密、数据压缩等过滤器。经数据输出接口输出的数据通过消息中间件传输到目标节点。目标接点的数据接口接收到数据后反向经过各种过滤器把数据还原出来,然后写入到目标数据源。(6)管道管理管道管理器负责管理数据交换过程中的传输管理,包括管理的创建、动态分配、撤消等操作。(7)日志监控日志监控按级别记录数据交换引擎在运行过程中的事件记录,提供监控功能。(二)数据接口数据共享交换平台支持三种数据接口方式:交换库方式、文件方式以及Web服务方式,业务系统通过交换平台进行数据共享交换时,可以根据实际的情况选择合适的数据接口方式接入交换平台。在接入节点时,根据实际情况51、选用一种或多种接口类型。对于有业务系统存在,只要求提供或获取共享业务数据的情况,建议采用数据库类型接口;对于需要获取基础数据的情况,以及实时性要求高的情况,建议使用Web 服务类型接口;文件类型接口根据实际情况决定是否采用。3.2.3.2 目录管理服务子系统目录管理服务子系统是支撑平台的核心子系统,提供数据资源目录的注册管理以及数据资源的发现定位服务。主要功能包括:(1)目录管理提供数据主题的管理功能,数据主题包含了对数据资源的语义信息和规格信息等;提供对目录层次结构的管理,包括系统自动管理以及手工管理两种方式。(2)目录服务按部门、专项以及分类标签等方式浏览数据资源目录;提供数据资源的检索和52、统计功能。3.2.3.3 共享数据管理子系统共享数据管理子系统是支撑平台的一个基础子系统,是实现数据资源共享交换的基础。主要功能包括:(1)数据标准管理提供公共数据元、信息分类和代码的配置管理功能。(2)数据源管理提供数据源的配置管理功能。(3)数据质量管理提供对共享数据的质量管理功能,包括问题数据的查询、浏览和统计。3.2.3.4 共享业务管理子系统共享业务管理子系统是支撑信息共享申请、授权业务开展的系统。主要功能包括:(1)共享业务流程提供对共享业务流程的支撑功能,包括共享业务申请和审核。(2)共享业务统计提供按部门、业务状态和业务时间等维度对共享业务统计功能。3.2.3.5 系统配置管理53、子系统系统配置管理子系统是支撑平台的一个基础子系统。主要功能包括:(1)共享域提供数据资源共享域的信息配置功能。(2)全局配置提供组织机构、系统信息等全局配置功能。3.2.3.6 系统安全管理子系统系统安全管理子系统是支撑平台的一个基础子系统。主要功能包括:(1)用户管理提供用户、用户组、角色管理功能。(2)权限管理提供基于角色(RBAC)的权限管理功能。(3)操作日志提供用户操作日志的查询和导出功能。3.2.4 数据共享交换平台3.2.4.1 交换网络结构一般数据交换有两种常见的交换结构:星型交换和网状交换。在星型交换结构中,所有端节点都只与中心节点相关,通过中心实现数据交换;而网状交换结构54、中,数据可以在任意两个节点之间直接交换。经过调研和分析,业务部门之间存在着复杂的数据共享和交换需求,并存在以下特点:(一)同一批共享数据通常需要共享给多个子系统;(二)对同一批数据,不同的子系统应用的需求存在差异;(三)各个子系统独自开发,技术平台不一,数据标准不一;(四)数据共享和交换要求进行备案。因此,数据中心采用星型交换结构。采用星型交换结构有以下的优点:(一)避免重复提供数据如果同一批数据,有多个子系统需要共享,在星型交换结构中,数据提供方只需要提供一次数据。根据以上的分析,这种情况在本期项目是普遍存在的,星型交换结构有助于减少接入单位在开发、调试、实施、维护等各个阶段的工作量。(二)55、中心统一控制简化管理在网状交换结构中,交换服务分布在每一个节点,因此在进行服务管理时需要对每一个节点进行管理。这样数据共享交换平台的服务管理系统可能会设计成一个分布式的管理系统,或者是让管理员分别登录到不同的节点进行管理。无论采用何种实现方式,管理员都必须面对在N个不同节点上管理服务的问题。而在星型交换结构中,所有的交换服务都是集中在中心端,管理员只需要管理中心节点上的服务。(三)降低实施过程对网络连接的要求提供稳定可靠的数据交换服务,是数据共享交换平台的关键任务,采用星型交换结构,只需要保证各个端节点与中心节点之间的网络正常联通,而采用点对点网状交换结构则需要保证每两个点之间都联通。在实施过56、程中,不一定能保证每两个交换节点之间网络联通。因此采用星型交换结构在一定程度上降低数据共享交换平台的实施要求。3.2.4.2 交换概念模型交换概念模型由中心交换结点和端交换结点组成。端交换结点接收和发送部门的交换信息。中心交换结点管理交换网络内端交换结点的数据交换服务,并根据需求形成共享信息库。交换的概念模型如下图所示:图表 2 数据交换概念模型交换概念模型说明如下:(一)业务信息是由各部门产生和管理的数据资源;(二)交换信息是端交换结点用于存付参与交换的数据资源;(三)共享信息库是可以为多个端交换结点提供一致的数据资源的信息集中存储区。任意一个端交换结点是可以按照一定的规则访问共享信息库。(57、四)端交换结点是数据资源交换的起点或终点,完成业务信息与交换信息之间的转换操作,并通过交换服务实现数据资源的传送和处理;(五)中心结点主要为交换信息提供点至点、点到多点的信息路由、信息可靠传送等功能。在两个端交换结点之间可以有0个或若干个中心交换结点;(六)交换服务是交换结点传送和处理数据资源的操作集合,通过不同交换服务的组合支持不同的服务模式。交换服务按照数据交换任务的重要性以及时效性要求设置为不同的优先级。一般情况下,交换服务按照预先设定的调度计划执行。在服务器、网络资源紧缺的情况下,高优先级的交换服务可以优先执行,确保满足数据交换的时间要求。3.2.4.3 交换体系结构数据共享交换平台由58、中心交换节点和端交换节点组成,依托统一的外部网络,通过采用一致的交换协议,实现跨地区、跨部门应用系统之间的数据交换。数据中心作为中心交换节点,各部门的前置机作为端交换节点。部门业务系统通过交换桥接实现与前置机互联,接入数据共享交换平台。数据中心的交换体系架构如下:图表 3 交换体系架构业务库是由各部门产生和管理的数据资源库。交换库是部门提供本部门交换数据、获取其他部门交换数据的存储库。交换文件作用与交换库相同,把部门提供本部门交换数据、获取其他部门交换数据以文件形式存放在前置机上。中心交换节点提供交换数据的采集、分发服务,实现交换节点之间的数据路由和传送功能。端交换节点提供交换数据的存储库、数59、据写入和读取接口以及文件上传和下载接口,业务系统与端交换节点之间通过交换桥接进行交换数据的提供和获取,并实现业务数据和交换数据之间的转换。端交换节点是交换平台中数据交换的起点或终点。数据交换过程可分为数据提供、数据采集、数据分发和数据获取四个阶段: (一)数据提供:数据从提供方的业务系统转换并传输到提供方的前置机;(二)数据采集:数据从提供方的前置机传输到中心节点;(三)数据分发:数据从中心节点传输到使用方的前置机;(四)数据获取:数据从使用方的前置机传输并转换到使用方的业务系统。其中,数据提供和数据获取流程由部门的交换桥接负责。数据采集和数据分发流程由中心数据共享交换平台负责。业务系统可以通60、过公开Web服务的方式向数据中心或其他部门提供数据。部门获取数据时,也可以直接从数据提供方公开的Web服务获取数据。数据中心公开的Web服务主要用于共享基础数据,业务系统可以调用数据中心的数据共享服务查询基础数据。3.2.5 共享数据管理系统在没有数据标准的时候,数据中心对同一个数据字段可以从多个数据来源采集数据。对于同一个数据字段,数据中心对于该数据字段保存多个来源的版本。公共数据维护系统提供工具、服务来展现数据的不一致性,数据管理员根据工作制度,对数据字段进行多种手段核实字段的真实数值,如果在一定的时限内不能解决冲突,则可以发布该数据字段的多个版本,每个版本都标明数据字段的来源,并指示该数61、据是存在冲突的。通过数据共享与交换平台以数据服务的方式从各业务部门采集数据,保存到公共数据缓存库,使用公共数据维护系统进行数据比对、冲突检查、数据审核、数据转换。当数据达到一致性、完整性要求时,数据被发布到公共数据发布库,通过数据共享与交换平台以数据服务的形式提供数据使用方访问。数据管理系统面向数据中心和业务部门的数据管理员,确保数据的一致性、准确性和完整性,为数据质量把关。3.2.5.1 功能设计 数据管理工作流实现对数据管理的主要工作流程的管理,方便业务部门提供、使用和交换数据。比如从数据使用方提出申请,然后数据提供方进行审核,然后双方协商数据交换规则到最后配置实现的整个工作过程的管理。 62、数据转换建立业务部门数据于标准规范数据的转换映射关系和转换规则,将业务部门的数据转换为符合标准规范的数据。 数据整理对缓存数据库中的各业务部门数据进行比对、清洗,检查数据冲突,对数据进行审核校验。确保数据一致性、完整性。 数据发布数据管理系统把经过比对、审核、转换之后的具有完整性、一致性的数据保存到数据中心的发布数据库,经过数据共享与交换平台发布提供各业务部门使用。 主题管理数据中心以主题为单位实现数据采集、数据交换、数据共享、数据比对以及数据发布。因此必须提供主题管理功能。 元数据管理对共享数据进行元数据管理,以主题的方式组织数据资源。 数据标准管理对数据标准的内容、数据标准的版本进行管理,63、将标准变更对业务系统的影响屏蔽在数据接口系统一级。 数据维护通过数据管理系统进行日常的数据维护工作,如:数据备份恢复。提供对业务系统的异地容灾数据备份的管理支持。3.2.5.2 逻辑结构数据管理系统以主题的方式组织数据资源,提供元数据管理、数据供需关系管理、数据标准规范管理,与数据共享与交换平台结合,提供数据转换、整理、发布等功能。数据管理系统逻辑结构示意图3.2.6 数据接口系统数据中心的共享交换网络由数据中心的数据共享交换系统和部署在各业务部门的数据接口系统构成。数据接口系统由3部分组成:数据共享和交换系统、缓存数据库、数据管理系统。数据接口系统提供业务部门和数据中心、业务部门之间的接口功64、能,在统一的数据共享与交换平台下进行安全、可靠、有效的数据共享与交换,并提供元数据管理、主题管理、数据供需关系管理、数据标准版本管理、数据安全管理。数据接口系统不直接影响业务系统的日常运作。数据共享和交换的细节、安全性和权限控制都在数据接口系统中封装,并在统一的规范下,由业务部门进行管理。数据接口系统与业务系统是松耦合的关系。图表 3.24 数据接口系统逻辑结构3.2.7 服务器系统设计3.2.7.1 设计原则在服务器系统设计中,我们遵循以下的原则:实用性无论对于何种计算机系统,实用性永远是需要放在首位和着重考虑的。一个系统的建设是一项工程的实施,它的最基本的目标是建立一个适用实际环境的、能满65、足用户功能需求的实用系统,而不是一味追求技术的领先和产品的更新。广泛采用标准随着计算机技术的发展,芯片技术、存储系统、各种传输协议以及与外部系统的接口等都已逐渐形成标准。采用标准化的设计,能使系统具有良好的可扩充性及兼容性,能与其他厂商产品配套使用,给各种系统软件和应用软件的安装运行带来方便,同时有利于系统的升级和与其他系统的数据交换。先进性与适用性的统一计算机技术的发展与时间不是简单的线性关系,从投资保护及长远考虑的角度来看,在系统设计时保持一段时间的先进性也是十分必要的,重要的是把握好先进性与实用性和适用性之间的关系,取两者之间的最佳平衡点,使用户的投资得到最大化的收益和回报。注重售后服务66、衡量设备及产品的优劣,不仅应以设备及产品本身的质量作为尺度,还应充分考虑厂商的售后服务。在系统正常使用情况下,软硬件的及时升级、维护,以及在系统出现故障时修复响应时间、备品备件的充足程度等,都将直接影响到整个系统的运行状况。因此,选择优秀的设备供应商和全面考察供应商的售后服务情况也是服务器系统选择中重要的原则之一。3.2.7.2 服务器系统选择的依据服务器系统的运算能力和I/O能力往往是考察系统性能优劣的重要指标。目前较为普遍采用的一个衡量服务器系统处理能力的参数是TPMC值,TPMC值是测试单台服务器或集群系统在配备特定的操作系统,采用特定的数据库的情况下每分钟处理事务的能力(Transac67、tion Per Minute)。TPMC值越高说明系统处理能力越强。通常情况下,用户的应用每秒钟会触发几个事物这一基准数据的取值范围是可以定量计算的,这样针对某个联机事物处理系统,对系统服务器的选择就可以参照服务器的TPMC值来确定了。但是同时也应该看到,服务器TPMC值是通过实验手段取得的,某系统的TPMC值是在其生产厂商所送检的特定配置的服务器硬件 + 特定配置的操作系统 + 特定配置的数据库系统所得出的事物处理能力的衡量,其配置中任何一项的变化都可能会对TPMC值有很大的影响。例如在硬件和操作系统不变的情况下,改变数据库系统类型或它的配置,就可能在很大程度上改写系统的TPMC值,不可忽68、视的是,应用软件设计和编码的好坏能在更大程度上影响系统的事物处理能力。所以对TPMC值的作用,仅可以用作参考,不可以生搬硬套,按照一般的原则,选择服务器时一般对TPMC值要求要高一些。3.2.7.3 需求分析需求分析数据中心服务器系统的特点是业务复杂,处理数据量较多,连接用户数多,服务器的选型,主要应考虑以下几方面的因素:服务器的运算能力服务器的处理需要考虑对高峰时业务受理的实时响应,考虑业务的复杂性,服务器需要实时的与多个业务分系统进行数据采集、比对、整理和分发。需要服务器有很高的处理能力。服务器的内存服务器还需要对实时产生的数据进行实时汇总、分发。要实现汇总、分发的实时高效,需要将实时信息69、放入内存,进行处理,才能提高系统的性能,这样服务器需要有较高的内存。高的I/O能力对每天生成的数据需要实时入库,需要有很强的I/O能力,使得数据的入库不会成为系统的瓶颈。系统扩展在追求数据服务器单机高性能时,也需要考虑业务巨大时的系统负载的分流,系统在规划设计时,在软件设计上进行合理处理,使得应用可以在单机上运行,也可以有不同的服务器上进行任务分担,共同完成实时的业务处理。3.2.7.4 性能测算服务器系统是整个数据中心的心脏,负责管理数据中心的基础信息、共享信息、各专业区域信息以及业务应用过程中发生的相关业务数据、以及数据管理的过程中产生的比对信息、整理信息、管理信息等,同时为各个分系统提供70、共享信息。服务器的处理能力作用体现在每秒钟的事务处理数量上。事务处理主要包括卡业务受理、数据的实时汇总、入库、分发等功能。根据日业务量可以推算出服务器每秒需要处理的事务数。服务器主要负责业务业务逻辑的实现和数据的处理,因此它的处理量主要表现在TPMC 即事务处理上。3.2.8 存储系统设计3.2.8.1 设计原则由于数据中心存储了所有相关的业务数据、统计数据等重要数据,存储系统作为数据存储的设备,对于它的可靠性要求很高。存储设备必须满足以下需求: l存储系统必须具有高性能、高可靠性和足够的容错特性,提供多种信息保护、共享、管理方案,以保证信息的高可用性 l必须拥有足够的系统扩充性,以支持目前社71、会保障的数据容量,同时还要考虑未来业务的发展。 l高性能智能型企业存储,对主机CPU的性能无影响,将主机资源充分应用于业务系统,同时还要考虑未来业务的发展 l具备多平台、企业级的连接能力,以便于主机的选型和系统的整合 l满足作数据远程镜像备份(容灾)的要求3.2.8.2 主流存储技术比较及建议1. 直连方式存储 (Direct Attached Storage-DAS)存储设备是通过电缆(通常是SCSI接口电缆)直接到服务器。I/O请求直接发送到存储设备。这种方式是连接单独的或两台小型集群的服务器。它的特点是初始费用可能比较低。可是这种连接方式下,对于多个服务器或多台PC的环境,每台PC或服务72、器单独拥有自己的存储磁盘,容量的再分配困难;对于整个环境下的存储系统管理,工作烦琐而重复,没有集中管理解决方案。所以整体的管理成本较高。2. 网络连接存储(Network Attached Storage - NAS)NAS设备通常是集成了处理器和磁盘/磁盘柜,类似于文件服务器。连接到TCP/IP网络上(可以通过LAN或WAN),通过文件存取协议(例如NFS,CIFS等)存取数据。NAS将文件存取请求转换为内部I/O请求。这种方式是将存储设备连接到基于IP的网络中,不同于DAS和SAN,服务器通过“File I/O”方式发送文件存取请求到存储设备NAS。NAS上一般安装有自己的操作系统,它将F73、ile I/O转换成Block I/O,发送到内部磁盘。NAS系统有较低的成本,易于实现文件共享。但由于它是采用文件请求的方式,相比块请求的设备性能差;并且NAS系统不适合于不采用文件系统进行存储管理的系统,如某些数据库。3. 存储区域网络(Storage Area Network - SAN)存储设备组成单独的网络,大多利用光纤连接,采用光纤通道协议(Fiber Channel,简称FC)。服务器和存储设备间可以任意连接,I/O请求也是直接发送到存储设备。光纤通道协议实际上解决了底层的传输协议,高层的协议仍然采用SCSI协议,所以光纤通道协议实际上可以看成是SCSI over FC。存储区域74、网络的优点如下:服务器和存储设备之间更远的距离(光纤通道网络:10公里相比较DAS的SCSI:25米); 高可靠性及高性能; 多个服务器和存储设备之间可以任意连接 集中的存储设备替代多个独立的存储设备,支持存储容量共享; 通过相应的软件使得SAN上的存储设备表现为一个整体,因此有很高的扩展性; 可以通过软件集中管理和控制SAN上的存储设备,提供数据共享由于SAN通常是基于光纤通道的解决方案,需要专用的光纤通道交换机和管理软件,以SAN的初始费用比DAS和NAS高。4IP SAN如果SAN是基于TCP/IP的网络,实现IP-SAN网络。这种方式是将服务器和存储设备通过专用的网络连接起来,服务器通75、过“Block I/O”发送数据存取请求到存储设备。最常用的是iSCSI技术,就是把SCSI命令包在TCP/IP 包中传输,即为SCSI over TCP/IP。IP SAN的优势在于: 利用无所不在的以太网络,一定程度上保护了现有投资。 IP存储超越了地理距离的限制,适合于对关键数据的远程备份。 IP网络技术成熟,不存在互操作性问题 IP存储减少了配置、维护、管理的复杂度。 IP网络已经被IT业界广泛认可网络管理软件和服务产品可供使用 千兆网的广泛使用大大提高了IP网络的性能 万兆网络技术的发展,使IP存储在性能上可以超越FC存储总结:性能上:FC性能最好,单端口可以达到2Gbps的带宽;N76、AS性能最差,即使采用千兆网络,通常只能3040MBps;单千兆iSCSI可以达到6070MBps;万兆网络下,单万兆口的速度可以超过500MBps。扩展性上:FC和iSCSI采用SAN的架构,扩展性最好,在存储网络中,易于增加用户或增加存储模块。应用成本上:FC的应用成本最高,需要配套的昂贵的光纤交换机(8端口光纤交换机大约34万元);每个服务器需要配光纤通道卡(光纤通道卡50001万元);以及采用光纤介质;相比之下,iSCSI只需要普通的以太网交换机(8端口千兆交换机1000元);服务器本身带有千兆网口,即使增加一个网卡也就是500元,采用普通的超五类线就可以,价格可以忽略不计;市场定位:77、FC占据高端,iSCSI处于中高端,NAS和DAS处于低端结论:综合比较San,Nas,ip-san等主流存储技术,建议使用FC-SAN实现。3.2.8.3 Raid类型配置建议存储系统中主要的RAID技术有RAID0(条块化)、RAID0+1(条块化并镜像)、RAID5。采用RAID0技术最经济,存储空间利用率为100%,性能也最好,但是数据没有冗余保护,生产系统中一般不采用。RAID0+1技术性能仅次于RAID0,但经济性最差,存储空间利用率为50%,数据安全性最好。RAID5存储空间利用率超过80%,数据也有冗余保护,但性能差于RAID0+1,但在存储系统Cache比较大的时候性能也基本78、可以保证。从应用需求看,应用对IO系统的传输带宽并不敏感,而对IO系统单位时间内能提供的IO次数要求比较高。同时,对文件处理和数据库批处理而言,鉴于单个文件或数据库表空间很难分配到不同的存储系统上,因此单个存储系统的IO指标越高越好。要提高IO系统在单位时间内的IO处理次数,可以通过配置比较好的RAID控制卡和比较大的读写Cache实现,但从节省投资方面考虑可以选择RAID5,应用软件中采用了许多先进的技术,如大内存处理、多进程多线程等技术,可以显著解决IO的瓶颈,因而RAID5也可以保证系统性能。3.2.9 灾备系统设计3.2.9.1 设计原则为数据中心提供灾备方案时,主要考虑以下三方面因素79、: 灾难承受程度:要明确用户计算机系统需要承受的灾难类型、系统故障、通信故障、长时间断电甚至火灾、地震等各种意外情况所采取的保护方案不尽相同; 业务影响程度:让用户必须明确当计算机系统发生意外无法工作时,导致业务停顿所造成的损失程度,也就是定义用户对于IT环境发生故障的最大容忍时间。这是我们设计灾难恢复方案的重要技术指标; 数据保护程度:是否要求数据库可以恢复所有提交的交易并且要求实时同步数据也就是数据的连续性和一致性,决定了灾难恢复方案规模和复杂程度的重要依据。 提供的灾难恢复方案可以满足数据中心对于计算机系统、数据的严格保护要求,保证即使发生断电,火灾等严重灾难时,外网业务的相关关键数据不80、会丢失和缺损,确保业务数据在主中心和备份中心同步更新,保证数据最大的完整性。3.2.9.2 灾备技术比较通常说来,灾难恢复方案建议用户建立两个数据中心,XX主数据中心和南宁备份数据中心。正常情况下,应用运行在主数据中心的计算机系统上,数据也存放在主中心的存储系统中。当主数据中心由于断电,火灾甚至地震等灾难无法工作时,则立即采取一系列相关措施,将网络、电话线路切换至备份中心,并且利用备份中心计算机系统重新启动应用系统。而这里最关键的问题就是切换过程时间最短,同时尽可能保持主数据中心和备份中心数据的连续性和完整性。而由于社保数据的重要性,如何解决主、备中心数据库数据备份,恢复则是灾难恢复方案的重点81、。 - 传统的磁带备份方式一般采取定点备份,而当系统崩溃时。距最近一次备份时间之间的数据将全部丢失,无法恢复。而且磁带备份和恢复时间比较长,由于速度慢,缺乏实时性,无法满足用户大数据量数据恢复及数据库连续性、实时性的要求。 - 现在流行的灾难恢复方案主要是采用硬盘备份的方式。它的主要原理是在备份中心建立一套硬盘存储系统,通过通信线路,实时地将主中心更新数据拷贝至备份中心存储系统中,保证主、备中心数据的实时一致性。当主中心无法工作时,备份中心可以立即接管业务,并且确保数据的最大完整性。其主要实施方法有以下三种: 利用数据库厂家的软件产品完成远程备份:现有的一些数据库厂家例如Oracle数据库可以82、提供STANDBY数据库功能,通过通信网络将实际数据库日志文件传至备份中心存储系统,备份中心的STANDBY数据库按照主数据库结构从日志文件中重新恢复数据库。这种方法投资成本小,数据恢复相对磁带较快,缺点就是占用主机资源,日志文件建立过程中发生灾难时,整个日志文件数据将丢失; 利用主机进行远程数据镜像:主中心存储设备与备份中心存储设备进行镜像,主机同时将数据分别写到本地和远程磁盘上。主机上安装灾备软件,如AIX上的HAGEO、SUN上的VERITAS(VERITAS Volume Replicator)等。这种方法优点就是可以保证数据的实时一致性,但是存储镜像通过主机完成,这将极大地影响主机性83、能,当由于通信故障,一个镜像操作无法完成时,主机将无法进行下一个写操作; 基于智能存储系统的远程数据复制: 磁盘阵列将磁盘镜象功能的处理负荷从主机转移到智能磁盘控制器 智能存储系统上。如IBM的PPRC、EMC的SRDF等,基于智能存储的数据复制由智能存储系统自身功能实现数据的远程复制和同步,即智能存储系统本身来完成数据的复制功能,同主机无关,不占用主机的CPU,连接可以采用裸光纤、ATM、E1/E2、T1/T3、TCP/IP等。由于这种方式下数据复制软件运行在存贮系统内, 因此较容易实现主中心和容灾备份中心的操作系统、数据库、系统库和目录的实时拷贝维护能力, 且一般不会影响主中心主机系统的性84、能。而且上层可以是不同主机平台。如果在系统恢复场所具备了实时数据,那么就可能做到在灾难发生的同时及时开始应用处理过程的恢复。 三种实施方法的比较:第一种方案的最大缺点就是灾难发生时,系统数据备份可能不完全,丢失数据量较大,而且对系统正常工作时的系统性能影响较大。第二种方案由于远程备份要占用主机的CPU、I/O等资源,同时根据备份方式的不同,可能对主机的性能有一定的影响,但它能够保证数据备份的完整性。第三种方案能够完全确保数据的一致性,同时对主机系统的性能影响较小,对主机平台的要求也低,但缺点是系统投资较大。3.2.9.3 灾备解决方案数据中心系统的主要数据存储包括两大部分:应用系统数据以及统计85、分析系统数据。两个业务特性的不同决定了我们需要考虑实施不同的数据备份策略。下表是我们针对其备份系统需要考虑的业务特性所进行的比较。根据上表,我们知道,业务生产系统的数据备份工作以严密、最大限度保护数据、快速恢复为宗旨。而统计分析系统的数据备份工作以高效、简便,对数据起比较好保护作用为宗旨。数据中心系统数据量很大,传统的LAN-Base以及Server-Base的备份方式难以满足数据中心的需求,我们建议采用基于ISAN架构的企业备份解决方案。3.2.9.4 备份策略为了对业务生产系统数据实施良好的备份,最大限度保护数据,建议实施下列备份策略: 数据库运行在归档模式下; 每个礼拜对数据库进行一次完86、整的数据备份,数据库的完整备份保存2个版本,每个备份保存两个备份周期; 每天对数据库做增量备份,增量备份保存两个版本,每个备份保存两个全备周期; 每天对数据库进行归档日志文件的备份,每次备份时间间隔建议为30分钟,保存2个完整备份周期内的所有归档日志文件; 将配置信息表等存放在单独的表空间上,减少在类似数据丢失情况下进行数据库恢复的时间; 对单个重要的表可以采用export进行逻辑备份。逻辑备份可以考虑保留在本地硬盘上或者磁带上; 对备份数据的磁带进行异地保存。3.2.10 网络系统设计3.2.10.1 设计原则1) 设备高性能构建网络的组网技术必须是高带宽的组网技术;交换设备必须支持线速交换87、,以保证无阻塞的数据交换; 2) 设备先进性所选的设备必须具有很好的扩展性,当网络规模或带宽需要扩展时,能够以最小的代价满足新的需求。3)网络可靠稳定性可靠稳定的网络平台,是应用业务系统得以实施和推广的基石。网络平台的设计必须从设备、网络拓扑结构、网络技术等几个方面保证网络的可靠稳定性。4) 网络安全性除了要保障网络平台的安全性,还需要在一定程度上保障应用业务系统和其它网络资源的安全。网络平台应该从几个方面保证网络安全:1)设备本身的访问安全 2)内部网之间资源访问安全 3)路由系统安全 4)互联网访问安全。3.2.11 安全保障体系数据中心的安全保障体系是确保数据中心系统安全性,保障在不同的88、业务系统之间(包括核心业务以及各种相关业务系统)以数据中心为核心进行数据共享、数据存取、数据交换等过程中的全面安全性。整个安全保障体系可分为:物理安全、网络安全、系统安全、应用软件安全和信息资源安全。数据中心的安全保障体系是贯穿整个体系架构每个层次各系统的。各子系统的设计与构建都要把安全保障作为关键部分。实现数据中心的安全保障不仅要从技术层面,还需要从管理层面考虑。数据中心系统的安全隐患主要来自于外部侵入和内部破坏,系统的安全包含技术的安全、法律和制度的保障等,安全建设包括权限与认证体系、信息安全处理体系、信息传输安全体系等方面。数据中心安全体系示意图系统的每一层次均有安全性的问题,安全策略包89、括物理安全、网络安全、系统安全、应用安全、数据资源安全。同时从安全技术和安全管理机制两个方面提供安全保障。3.2.11.1 物理安全物理安全实现主要包括机房安全和人员管理,具体细节详见数据中心安全子项目的说明。3.2.11.2 网络安全通过合理部署安全防御系统(如防火墙、入侵检测等),并通过统一安全管理服务平台实现对各种不同的安全防御设备的统一管理、配置、监控、分析等,提供全面的、基于统一安全策略的网络安全防御,避免来自各个不同目的的攻击、干扰和非法访问问题。各种安全防御技术的主要功能如下表所示:名 称配 置防火墙在网络之间执行访问控制策略(在应用层之下)。通过拦阻机制或允许机制实现对跨网络的90、各种连接或访问进行控制,确保只有满足安全策略的信息流通行。入侵检测入侵检测系统采用安全监测控制器和探测器两级的分布式结构,探测器配置在网络的敏感部位进行信息的采集,而安全监测控制器则对所收集到的信息进行分析处理,判断网络是否遭到入侵攻击。漏洞扫描漏洞扫描系统负责定期或不定期地调用网络安全性分析、操作系统安全性分析软件对整个内部系统进行安全扫描和检测,及时发现网络新的安全漏洞并予以补救病毒防治提供全网一致的病毒防治系统部署和管理,负责对各类计算机病毒的检测与杀灭。提供病毒免疫方式包括病毒预防、病毒诊断、病毒杀灭、病毒检测等。安全审计对各种网络安全系统、接入实体的详细操作记录、各电子应用系统所产生91、的具体日志信息进行全面的整理和详细的分析统计,提供强大有效的查询、报表和分析功能以便于管理员使用。3.2.11.3 系统安全系统安全包括:操作系统安全、数据库系统安全、应用服务器系统安全和Web服务器系统安全。操作系统、数据库系统、应用服务器是数据中心系统应用的支撑系统级平台,数据和软件的丢失、篡改、窃取、非法复制、滥用等对系统造成的后果是灾难性的,对社会造成的影响是严重的。因此要求操作系统、数据库管理系统本身的安全级别应能达到GB17859-1999第3级安全标记保护的主要安全特性。3.2.11.4 应用程序安全应用程序安全是构建在系统平台安全性之上的。结合数据中心的安全认证平台,在设计上,92、数据中心的每个应用程序需要有自己的安全模型,但在开发期间应遵循一组标准的指导原则。采用用户验证和用户授权、加密、数字签名、XML安全技术等手段从应用程序一级进行安全保障。3.2.11.5 数据安全数据是信息系统的核心,数据安全是数据中心电子安全体系建设信息安全的重要组成部分。从数据中心数据流的分析来看,数据主要存在于两种状态中,一个是数据库中,一个是在传输过程中。在数据交换的过程中,必须通过严格的加密机制以及用户身份验证机制保证数据交换的安全。数据安全包括几个层面上的内容,包括:系统层面上的安全:采用可靠的操作系统(C2级)保证系统对于用户口令、权限的验证。网络层面上的安全:对主机进行IP地址93、的访问列表限制,可细化到每个协议的资料包程度。数字证书层面的安全:采用CA认证,保证与资料中心进行资料交换的主机身份都是经过认证的。交换层面上的安全:采用加密以及用户身份认证机制。要达到数据安全的目的,至少要满足以下三点:首先需要对两种状态中的机密数据进行加密。其次,对核心数据的访问进行控制,再次定期对数据备份,防止意外发生。3.2.11.5.1 核心数据加密数据加密是用来保证数据即使被窃取之后,也很难了解数据的内容。因为保税区的特殊情况,对数据的保密和安全要求极为严格,因此除了在数据通过网络传输过程的保密和安全采取有效措施外,还要对数据库中的静态数据(如账号、密码、签名信息和财务数据等)和系94、统配置信息等核心数据进行加密,在显示时通过用户程序进行解密。这样,防止有人直接读取数据库表数据,获知核心数据的内容,功能甚至可以防止站点管理员、数据库管理员对数据的窥视。以上描述的功能可以在平台一级以统一的API提供数据加密的服务,核心数据的选择原则,需要根据应用的情况来决定。3.2.11.5.2 数据访问控制访问控制是指通过应用一级的控制,来保证数据的访问安全和数据的操作安全。也就是说,只有通过认证而且经过授权的用户,才能浏览他权限范围之内的数据;只有通过认证而且经过授权的用户,才能进行他权限范围之内的应用功能的操作。可以通过对应用程序的权限的细分来达到对应用程序使用数据范围的精确控制。3.95、2.11.5.3 数据传播和复制因为数据中心的数据存储方式是集中式存储,基于这种情况,如果在不同数据库中存储的、同类数据的出现了不一致的现象,将在整体上对数据的可信度产生影响。因此,需要采用数据传播和复制+传播复制的统一规则来实现全局数据一致的问题,保障数据安全。3.2.11.6 整体安全策略的说明数据中心系统的安全性是一个整体的安全性,任何一个层次的安全隐患都会造成整个系统的不安全。数据安全、应用安全和系统安全由数据中心项目负责保证,物理安全、网络安全、身份认证等由安全平台项目负责保证。数据中心与业务部门的数据交换网络是在内网,内网与公众网是安全隔离的,数据中心系统本身是在一个相对安全的网络96、环境中运行,因此,安全性的保障要考虑适度安全。安全平台提供安全基础设施、身份认证,清晰定义安全接口,数据中心基于安全平台进行系统、应用、数据的安全设计,并从整体上对数据中心的安全性进行优化。3.2.12 数据中心典型应用3.2.12.1 数据交换平台3.2.12.1.1 运行模型数据交换平台基于市数据交换中心基础上进行建设,使用市数据交换中心目录管理服务建设数据共享目录,使用市数据交换中心数据交换平台实现数据各个成员单位的信息共享。数据交换中心目录管理服务支持多个专项目录,提供编目、注册、发布、修订、注销等目录管理功能,数据各成员单位使用市数据交换中心系统建设数据共享目录。数据交换平台可以调用97、市数据交换中心的目录接口获取数据共享目录的信息,数据各成员单位用户既可以在市数据交换中心上使用数据共享目录,也可以在市数据交换平台中使用。数据交换平台使用市数据交换中心数据交换平台,实现成员单位之间的信息共享交换。数据共享成员单位同时也作为市数据交换中心的成员单位,接入市数据交换中心,形成数据共享交换网络。数据共享成员单位在市数据交换中心数据交换平台上进行数据信息共享。市数据共享信息库作为市数据中心的一个交换数据源,数据共享各成员单位共享的数据通过采集服务汇集到市数据共享信息库。市数据共享应用系统通过调用市数据交换中心交换管理接口获取数据共享交换服务运行情况,提供交换日志查询和统计等功能。数据98、交换平台总体运行过程如下:(一)数据提供:数据共享成员单位开发交换桥接,从业务库中抽取对外共享的数据,写入本节点前置机的前置交换库中。(二)数据采集:通过数据中心交换中心,把数据由各个端节点采集到中心节点,形成中心交换库。(三)系统衔接:通过数据交换中心目录接口将共享目录数据同步到数据共享信息库;通过数据交换中心分发业务数据到数据共享信息库。(四)数据处理:对数据共享信息库中的信息进行处理和整合,形成基础库。(五)应用支撑:基于数据共享信息库,建立数据共享应用系统,提供信息查询、信息预警、统计分析等功能。3.2.12.1.2 信息共享交换数据共享应用系统使用市数据交换中心的交换平台,实现数据信99、息共享交换。同时,通过调用数据中心接口实现交换服务运行情况展现功能。具体功能:调用数据中心接口展现交换总体交换情况、数据提供情况、数据获取情况,从多个角度展示交换情况。3.2.12.1.3 共享目录检索数据共享应用系统使用市电子数据交换中心的目录管理服务,实现数据共享目录的管理维护。并且调用数据中心目录接口实现数据共享专项目录展现,提供目录查询和资源定位等功能。本模块具体功能如下:(一)数据共享专项目录展现:以目录树方式展现数据共享成员单位的信息资源目录,方便用户定位资源及进行目录查询。(二)目录查询及数据资源展现:提供目录查询功能,用户可以通过资源提供方、资源名称、关键字等多个查询条件定位数100、据资源;提供数据资源档案,可以查看资源的数据规格等信息。3.2.12.1.4 共享数据查询服务体系决策信息,如国家和地方的政策、法规条例、决策咨询、战略发展研究报告(包括各职能机构和院所历年的研究成果)和阶段性的总体规划等;社会服务信息,如国际国内重大政治新闻、经济运行分析、热点透视、社情民意动态、税收征管、统计报表、市场供求信息、社会与经济预测信息、金融财经信息、科技与人才信息,等等;交流信息,部门之间因工作职能的需要交换信息,如各种公文、会议情况、总结报告、记录数据、办公文档、机关行政管理信息、经验介绍、驻外办事处等工作流信息。应对事件预案,整个城市的各类资源要素储备和分布状况,行政组织及101、人力资源调配预案,对自然灾害和意外事故的处理,重大突发事件的应急预案。城市地理信息,如城市地理状况、地下网、管、道和线的分布结构,以及城市规划与发展的思想库以及城市发展历史沿革等信息。3.2.12.1.5 业务数据整理业务数据整理系统是数据中心的一个重要组成部分,是数据中心的门户,它实现不同业务数据平台之间的数据交换、共享和业务流程的对接,实现异构数据整合。提供对各种数据库系统的访问能力,以实现异构数据库的互联。 提供不同数据格式间的自动转换能力,以保证各种格式的数据均能够按数据中心的规范格式存入数据库系统。 提供数据的过滤、填充功能,以实现抽取来源于各种系统的数据内容能够满足数据中心的要求。102、 提供数据库同步机制,以实现将各业务数据交换平台的中心数据库中的数据自动同步到数据中心的数据库中。3.2.12.1.6 决策支持系统决策支持系统和数据仓库执行的都是决策和趋势分析类的应用。决策支持系统中的一些技术可以很好地集成到数据仓库中,使数据仓库的分析能力更加强大。例如:决策支持系统中的传统统计分析模型可以帮助用户对数据仓库中的数据进行更加有效、更加深入的分析,从而更好地掌握和利用信息。数据挖掘是数据仓库应用中比较重要且相对独立的部分,它可以从数据仓库的海量数据中提取出人们感兴趣的知识,这些知识是隐含的、事先未知的潜在有用信息。提取的知识以概念、规则、规律、模式等形式提供给用户。数据仓库是103、面向决策分析的,具有从各种数据源抽取数据,并对数据进行清洗、聚集和转换等各种处理能力。从这个意义上说,数据仓库既是一个信息资源的存储机制,也是一个信息资源分析、处理的支持决策的系统。决策行为依赖于信息资源的良好组织,因而基于数据仓库的信息资源存储必然成为主流的信息资源存储方式。第4章、 运营及保障机制为保证数据中心建设的顺利进行和有效运行,必须有一套完善的运行管理机制和实用的运行管理系统来支撑。其中运行管理系统是运行管理机制的技术实现。4.1 运营机制本项目建设和运营的关键在于系统服务的推广和运作。因此,本着“合作、共享、效率、品牌”的原则,遵守市场经济的规律,本项目采用政府主导,银企联合的方104、式。本项目前期规划存储数据,中后期融入企业及商务数据,在项目建设期,以项目建设主体,实行项目管理;在项目运行期,以第三方合作公司为运维主体,充分依靠政府、协会、中介组织等渠道作用,来推广本项目开展的各项服务。4.2 运行管理机制运行管理机制的关键在于度的把握,要在众多可能互相矛盾的指标中找到平衡点。数据中心在建设和运行管理过程中需要把握信息公开与安全保密的度;由此形成信息共享与安全保密相结合的信息管理机制。为此,需要制定几个主要的制度:信息共享法规、数据安全管理法规和数据中心的运行管理制度。4.3 信息资源管理机制信息过度公开容易造成信息不安全,隐私泄露等问题;信息过度保密又容易造成信息割据和105、信息壁垒,不利于信息化的发展。为此需要对信息进行分类,哪些部门需要哪些信息,哪些部门可以获得哪些信息,做到“知必所需”,以共享为主题,以公开促应用,以安全为前提,以保密为手段建立一种信息公开与授权存取相结合、数据共享与信息保密相结合的机制。(1)信息共享法规该制度面向信息办和业务部门,实现对信息资源的开发利用。有关单位根据这一制度公开必要的信息,并获取其他部门公开的信息。信息公开是信息共享的前提,也是数据中心的运行基础,通过信息共享法规使各部门提供数据和使用数据有章可循。(2)安全管理法规该制度同样面向信息办和业务部门,实现对信息资源的安全管理。虽然数据共享是主题,但与此同时必须要有配套的安全106、保密制度,确保共享信息的合法使用,防止隐私的泄露造成的社会影响以及其他信息安全事故的发生。4.4 运行管理制度数据中心的运行管理制度主要面向数据中心的工作人员,包括日常工作制度、备份制度等。明确数据中心的管理架构,实施岗位责任制,分工负责,共同把数据中心建设好,管理好。通过定义一套数据中心的运行管理制度,可从行政的手段解决管理维护的问题,保证数据中心的安全可靠和高效运行。第5章、 连云港市市民卡数据中心运行平台硬件设备配置方案5.1 建设背景“城市一卡通”是城市现代文明的标志,对城市信息化与重组和优化社会公共服务流程,实现跨部门、跨地区的资源整合与信息共享,方便市民的生活,以提高管理效率和服务107、水平为目标,整合公共交通、教育、社会保险等公共服务领域的社会资源,为市民提供方便快捷的服务,以及消费、电子支付的应用平台和管理服务平台。根据连云港市市民卡公司的要求,我们在市民卡系统建设中本次着重考虑市民卡运营数据中心的运行平台方案设计。5.2 设计原则城市一卡通系统按照“统一规划、统一标准、统一平台、一卡多用、安全可靠、分期建设,逐步推广”的要求,并遵循“以需促用,以用促建,减少重复投资、并存过渡和逐步取代”的原则进行建设。5.3 应用描述城市一卡通的应用方便市民手持一张“市民卡”,就可以在商场、超市、餐饮等小额消费领域以及公交、出租、水、电、气、有线电视、通信等公共事业领域快速付费,可以方108、便地进行身份验证及各种相关信息查询,最终实现城市通的互联互通。1. 城市交通:公交、出租、停车场收费、路桥收费等; 2. 公共事业:水、电、气、有线电视、电话费的缴纳等; 3. 小额支付:商场,超市,酒店,餐饮,药店等; 4. 教育应用:学生信息记录,校园就餐及消费、学籍管理、图书管理等; 5. 金融应用:圈存、圈提、消费、取现、转帐等; 6. 社会保障:医疗、养老、工伤、失业、生育,五保应用等; 7. 公积金:公积金办理、查询等; 8. 卫生医疗:个人健康档案、医疗就诊、病史记录; 9. 旅游娱乐:电影院,公园,游乐场,旅游景点等 10. 数字社区:居民物业管理,门禁,停车收费等; 11. 109、企业园区:员工身份识别,考勤,就餐等; 5.4 市民卡软件系统总体架构图5.5 系统软件平台功能设计1.门户平台门户平台功能的主要目的一方面是为决策提供依据,另一方面是为方便市民生活。普通市民可以通过登录门户平台查询自己的市民卡相关的各种业务数据。各级管理者登陆门户平台,根据不同权限查询不同的统计分析、数据挖掘后的综合信息,以对决策提供支持。2.统一身份认证平台统一身份认证平台负责管理城市一卡通系统各个业务应用子系统,以及管理维护用户访问各个子系统的权限,为现存和即将开发的各应用系统提供一个统一的权限管理平台。3.资金清算平台资金清算平台主要实现城市一卡通系统内市民卡小额电子支付功能的数据更正110、数据平衡、数据备份、数据整理、财务结算、自动转账、数据汇总、统计分析、消费查询等功能,并对小额电子支付功能涉及的所有费用进行统一结算和划账。4.数据交换系统数据交换平台负责整个市民卡信息中心与其它运营管理机构(如政府部门、银联、银行、商户等)的通信连接,完成交易信息的存储、路由等功能。它是实现信息资源共享互通,实现部门之间协同工作的基础。6.决策支持平台决策支持平台功能实现为高层领导提供城市一卡通系统内各业务系统数据的决策支持管理的分析应用。可以对市民卡系统范围内的所有信息进行动态的预警、对数据进行挖掘、综合分析,可以对历史数据进行跟踪,同时也可以对未来发展进行科学预测。5.6 市民卡数据中111、心运行平台设计 根据前期规划,市民卡将分期建立两个数据中心,一期建设一个生产中心(主中心),包括数据灾备系统;后期在数据灾备的基础上建设一个应用灾备数据中心。5.7 项目需求分析本次运行平台就是为了满足市民卡业务软件的需求,建设数据中心支撑平台,内容包括:网络系统建设;主机系统建设;存储系统建设;双机热备系统建设;网络安全系统;数据备份系统;数据容灾系统。根据业务软件应用的环境和平台要求,数据中心的具体需求为:针对本次项目建设的特点,系统需要保证业务7*24小时的连续性,可用性。1、 无单一故障点从硬件配置、通信线路等方面都要考虑到系统的可靠性、可用性,保证系统的整体冗余;建立先进的数据存储管112、理系统,保证数据的完整性、可用性。硬件配置:内存容错、硬盘RAID技术、网卡及HBA卡冗余、冗余风扇电源通信线路:多条线路之间的负载均衡、故障切换存储系统:采用SAN冗余结构,配置冗余控制器,数据管理控制软件。安全网关:在确保安全的情况下实现数据交换。2、 高性能由于业务的特点,应用处理在特定时段会出现处理高峰,这就对数据传输带宽、服务器、存储系统提出了很高的要求。3、系统级热备份当主服务器在由于某种意外原因而停机或出现故障时,备份机能立即切换上线,确保业务正常运行,而客户端感觉不到这个切换过程的存在,对客户端透明。5.8 市民卡数据中心总体拓扑上图是连云港市市民卡数据中心总体拓扑图,我们有必113、要对整个系统结构进行分析,以达到数据中心设计更加合理、更加贴近系统总体架构需求的目的。数据中心主要由双冗余的核心交换机、数据库双机热备系统、web门户双机热备系统、清算服务器双机热备系统,SAN存储系统、数据备份系统、网络安全管理和系统运维管理系统以及数据同城灾备系统、二期的同城应用灾备系统组成。5.9 网络系统由两台CISCO C4507R模块化核心交换机组成热备系统,若干接入交换机通过双上行链路连接核心交换组成一个冗余的网络结构,确保系统的高可用性;广域网连接通过防火墙及路由器接入公网,实现与外部单位的互联互通。同时通过安全区域的划分,在DMZ区设置系统访问的web门户网站,而其他数据库服114、务器、清算服务器等重要服务器放置在安全等级最高的内部区域,保证网络的安全隔离。5.10 主机系统主机系统包括两台数据库服务器、两台清算服务器、两台web服务器,它们两两组成各自的双机热备系统,保证系统的高可用性,确保在一台机器故障时,能立刻切换至另一台备机,使得应用能够不中断地提供服务。l 数据库服务器数据库服务器是最重要的数据处理设备,按照应用软件的要求选用具有极高可靠性和运算能力的IBM P720小型机,具体配置为8C 3.0GHz主频CPU,32G内存,300G SAS*2,DVD*1,4G双口光纤通道卡*2,千兆以太网口*4,1块双口千兆以太网卡, 1DAT160 Tape; 显卡*1115、;心跳异步卡*1,PowerHA集群软件,AIX6.1操作系统,由两台P720组成ORACLE数据库的高可用集群,最大限度地保证数据库运行的可靠性和数据处理能力。满足市民卡当前运行需求及未来卡用户量及使用量快速增长的业务处理需求。l 清算服务器清算服务器是处理业务流程的重要设备,根据应用软件的需求,选用X86架构中具有极高性价比的IBM X3850X5服务器,并用两台做成热备系统。具体配置为4*Intel Xeon Processor E7-4807(1.86GHz, 18M缓存),16GB, 2.5 2*300G SAS(10K), 2*Memory Card, Light Path, Co116、mbo, 2*Giga Ethernet,1块双口千兆以太网卡,2*HBA 4Gb, 4U, RSA II SlimLine, 2*1440w M。l Web服务器Web服务器是用户与系统人机交互的接口,根据应用软件的需求,同样选用X86架构中主流的IBM X3650服务器,并用两台做成热备系统。具体配置为2*Intel Xeon Processor E7-4807(1.86GHz, 18M缓存),16GB, 2.5 2*300G SAS(10K), 2*Memory Card, Light Path, Combo, 2*Giga Ethernet,1块双口千兆以太网卡,2*HBA 4Gb, 117、2U, RSA II SlimLine, 2*1440w M。l 开发测试服务器根据软件开发的需求,配置一台IBM P720小型机作为开发测试服务器,具体配置为4C 3.0GHz CPU/8G/2*300G SAS/2*4Gb HBA/4*1G NIC/DVD-ROM。该开发测试服务器后期可作为应用容灾中心应用灾备数据库服务器使用,可节省投资。5.11 存储系统存储系统是整个系统数据集中存放、管理的中心设备,也是业务软件运行处理的核心数据最重要的支撑平台,必须采用先进可靠的技术进行设计。 存储系统采用SAN结构,集中存储。 磁盘阵列内部应无单点故障; 任何磁盘控制器故障,均应保证阵列内数据的完118、整可用性; 存储系统应支持存储共享,支持异构平台、支持CLUSTER的主机结构。具体列出所支持的异构平台; 存储系统应具备阵列内快速数据复制功能; 磁盘阵列应配置足够CACHE做缓存,给出所配置的CACHE容量和能达到的最大CACHE数目; 远程镜像的支持能力; 快照的支持能力;要求SAN是开放的存储产品,SAN应能同时支持多厂商小型机及PC服务器,即SAN应能可靠地与主流厂家(如HP、IBM、SUN等)的主机互操作。SAN必须满足其内部无单点故障的基本要求,系统板、电源、风扇、控制器、Cache、总线和(或)通道等如果是完全硬件冗余的,则应在任一部件发生故障时,存储设备能自动切换使用该部件的119、冗余配置。根据要求存储系统采用SAN结构,通过高速光纤通道与主机相连,集中存储数据。在线磁盘阵列采用高端存储阵列,阵列内部架构设计采用全交换架构,关键部件冗余配置,必须支持多种RAID级别,配置较大的数据缓存,较多的主机端接口并有扩展能力。该存储阵列被多个系统共享,今后还有其它系统使用。必须有较好的扩展能力,可以动态增加硬盘、控制器等部件,扩充容量和性能。配置足够的存储系统缓存、存储系统处理器和与主机的连接通道,以保证存储系统的读写性能。关于存储系统硬盘的设计,在线存储阵列采用可靠性较高的RAID 5方式,同时采用全局热备磁盘。 存储系统选用业界一流的EMC公司产品EMC VNX5100,具体120、配置为VNX5100主机,含15颗600G、15K转、3.5英寸SAS硬盘10T SAS VNX5100管理软件,VNX5100 本地保护软件套件,VNX5100 远程保护软件套件、容灾软件,PowerPath路径管理软件主机计数-IBM AIX平台、Linux平台,PowerPath介质-IBM AIX、Linux平台。通过与两台光纤数据交换与各主机形成多链路冗余连接,确保数据读写通道的冗余性和可靠性。5.12 双机热备系统双机系统的两台服务器(主机)都与磁盘阵列(共享存储)系统直接连接,用户的操作系统、应用软件和双机高可用软件分别安装在两台主机上,数据库等共享数据存放在存储系统上,两台主机121、之间通过私用心跳网络连接。配置好的系统主机开始工作后,双机软件开始监控系统,通过私用网络传递的心跳信息,每台主机上的双机软件都可监控另一台主机的状态。当工作主机发生故障时,心跳信息就会产生变化,这种变化可以通过私用网络被双机软件捕捉。当捕捉到这种变化后双机软件就会控制系统进行主机切换,即备份机启动和工作主机一样的应用程序接管工作主机的工作(包括提供TCP/IP网络服务、存储系统的存取等服务)并进行报警,提示管理人员对故障主机进行维修。当维修完毕后,可以根据双机软件的设定自动或手动再切换回来,也可以不切换,此时维修好的主机就作为备份机,双机系统继续工作。 双机软件实现容错功能的关键在于,对客户端122、来说主机是透明的,当系统发生错误而进行切换时,即主机的切换在客户端看来没有变化,所有基于主机的应用都仍然正常运行。双机软件采用了虚拟IP地址映射技术来实现此功能。客户端通过虚拟地址和工作主机通讯,无论系统是否发生切换,虚拟地址始终指向工作主机。在进行网络服务时, 双机软件提供一个逻辑的虚拟地址,任何一个客户端需要请求服务时只需要使用这个虚拟地址。正常运行时,虚拟地址及网络服务由主服务器提供。当主服务器出现故障时,双机软件会将虚拟地址转移到另外一台服务器的网卡上,继续提供网络服务。切换完成后,在客户端看来系统并没有出现故障,网络服务仍然可以使用。除IP地址外,双机软件还可以提供虚拟的计算机别名供123、客户端访问。对于数据库服务,当有主服务器出现故障时,另外一台服务器就会自动接管,同时启动数据库和应用程序,使用户数据库可以正常操作。5.13 数据备份系统 数据备份系统主要对象是ORACLE数据库。由于业务系统在晚间使用率较低,甚至是不使用,系统有足够的备份窗口(即备份时间)用于对数据进行备份,因此此次设计备份系统的工作模式为投入成本最低的LAN-BASE即基于LAN的备份模式,不选用成本较高的LAN-FREE和SERVER-LESS备份模式。根据对业务系统的特点分析,我们建议数据备份的策略为:每天晚间进行一次增量备份,每三天进行一次差异备份,每周进行一次全备份。这样的备份策略能够有效地满足数124、据的备份要求,并能节约备份空间,使用户获得最高的效费比。数据备份系统选用颠覆性的Asigra无客户端代理的集中备份软件系统。传统的备份软件除了有一个备份服务端外,还需要在每个需要备份的服务器上安装相应的客户端代理模块,服务器数量中多是造成部署难度加大,系统结构复杂。而Asigra采用无客户代理模块,一个局域网内通过一个集中的备份代理服务器,就可以将所有服务器的数据备份到备份管理服务器所管理的备份存储介质中。它由备份几种代理服务器软件DS-VIEW和备份管理服务器DS-SERVER两部分组成,我们利用用户原有的一个IBM DS3512存储阵列作为数据备份的存储介质,加快备份系统的部署。同时该套备125、份系统可以根据未来发展的需要,将各相关合作方如超市、特约商家等得数据也集中备份到市民卡数据中心来,提供一种数据备份服务,可以按备份容量进行适当收费。5.14 运维系统运维系统管理和监控的对象主要是中心机房内各种平台服务器的硬件、操作系统、中间件、数据库及网络设备等。为管理人员提供直观的系统运行状态,并在系统运行达到设定阈值时能及时报警通知相关管理人员进行处理。运维系统选用国内具有自主知识产权的摩卡酷点综合运维系统。摩卡酷点运维系统具有数十种监测手段,几乎可以对所有的网络设备、主机、操作系统、数据库、应用进行监测。实现大规模多厂家网络的二层拓扑自动发现,支持主流网络设备:思科、华为、3Com、北126、电等。无论是网络设备、主机设备还是数据库系统,都可以实现不在安装代理的情况下对系统进行监控,方便系统部署。实现网络设备、网络安全设备的在线状态、CPU利用率、内存大小、设备日志的监控,网络安全设备的攻击事件监控、并发连接数监控。对网络线路运行状况监控,包括线路联通性、线路响应时间、线路流量、线路带宽利用率、线路错包率、线路丢包率、线路广播包数等信息。实现对Windows主机、Linux主机、Unix主机运作状况监控,包括主机在线状态、CPU利用率、内存大小、硬盘状况,进程状态及CPU和内存情况,主机提供的服务状态,主机的网络接口流量、错包率、丢包率等信息。实现对SQLServer数据库、Ora127、cle数据库、DB2数据库、Sybase数据库运行状况监控,包括数据库服务运行状态,数据库服务主要进程的状态、CPU利用率和内存大小,数据库表空间利用率、日志空间利用率、并发连接数,指定SQL语句的执行效率等。实现对各种Web服务器运行状况监控,包括Web服务器的CPU利用率和内存、Web网页能否正常访问、网页响应时间、网页访问返回代码、网页返回是否有特定的内容等。5.15 网络安全系统为了保证整个网络系统及主机应用系统能够安全健康地运行,有必要在整个网络中部署相应的网络安全系统。本次部署公网出口的统一安全网关,它集防火墙、VPN和入侵防御与检测功能于一体,充分保障局域网内网络设备及主机系统的128、运行安全,最大限度地阻止来自外部网络的攻击。统一安全网关及UTM设备选用启明星辰UTM810C,集成防火墙、路由功能、入侵防御、流量管理与带宽控制、内容过滤、上网行为管理、内网安全、实时监控与日志审计、VPN等功能。5.16 漏洞扫描系统 为了在日常运行过程中,能够及时发现网络设备、各种操作系统、数据库、中间件等系统中的软件漏洞,配置一套漏洞扫描系统,发现系统漏洞后能及时提醒管理人员及时下载相应补丁包进行安装,这样能够及时地堵住网络及系统的安全漏洞,保障系统的安全性,减少应系统自身漏洞而受攻击的几率。漏洞扫描系统选用启明星辰天镜系统,支持多种操作系统、网络设备作为扫描对象,还具备对各种数据库的129、扫描能力。5.17 数据灾备系统市民卡系统在投入运营后,其系统将几乎不能停顿,同时所有数据均保存在后台的集中的主存储系统中,使得主存储系统成为了可能的单一故障点,为了消除主存储故障后对应用造成的影响,本次项目拟在同城的其他建筑中建立一个数据灾备中心即第二机房,本次配置一台与主存储配置相同的灾备存储系统,在主备两个存储系统之间通过运营商的裸光纤进行互联,并设置为数据同步复制模式,即当有数据写入主数据中心的主存储时,同样的数据将实时复制到灾备中心的灾备存储中,保证在灾备中心中有一份与主数据中心一模一样并且可以立刻上线使用的数据拷贝,其数据格式及数据一致性与主数据完全相同,由于是同城灾备,距离很短,所以数据的传输延时极小,对应用不会产生影响。当主存储故障时,可通过在较短时间内的数据访问路径切换就可以使应用继续运行,主存储修复上线后,可以通过数据复制的反向同步再次同步两地存储系统中的数据,确保数据一致性。在建立了同城的数据灾备后,就为后期的在第二机房建立应用系统的灾备提供了坚实的基础,因为应用灾备的基础就是在灾备中心首先要有一份与主数据保持一致的完全可用的数据拷贝,后期只要添置相应的应用各主机系统配合已建成的灾备存储就可以完全建立一个真正的应用容灾系统,保证应用的连续性。第82页