2022演出市场内容监管智能系统项目可行性研究报告57页.pdf
下载文档
上传人:Le****97
编号:962209
2024-08-16
57页
1.23MB
1、XXXX区文化和旅游管理事务中心区文化和旅游管理事务中心演出市场内容监管智能系统项目演出市场内容监管智能系统项目可行性研究报告暨项目建议书可行性研究报告暨项目建议书建设单位:XX区文化和旅游管理事务中心编制时间:2022 年 9月目录第第 1 1 章章 项项目目概概况况.-1 1-1.1 项目名称.-1-1.2 项目单位.-1-1.3 建设依据.-1-1.3.1 政策依据.-1-1.3.2 参考标准.-2-1.4 建设背景.-2-1.5 建设必要性.-3-1.5.1 响应国家文化和旅游发展规划政策的需要.-3-1.5.2 服务于上海XX区城市数字化转型的需要.-4-1.5.3 强化重点演出内容2、审核和现场监管的需要.-4-1.5.4 改造和创新演出内容监管应用场景的需要.-5-1.6 建设目标.-5-1.6.1 激发城市公共空间的文化活力.-5-1.6.2 助力演出内容监管智能化升级.-5-1.6.3 促进演出市场的健康有序发展.-6-1.7 整体规划.-6-1.8 本期建设内容.-7-1.8.1 部署一套语音识别及机器翻译引擎.-8-1.8.2 建立统一的演出活动内容监管应用.-8-1.8.3 提升音视频、台本离线审核能力.-8-1.8.4 加强对演出演员库管理与审核能力.-9-1.9 总投资估算.-9-第第 2 2 章章 项目现状项目现状.-9 9-2.1 项目单位概况.-9-第3、第 3 3 章章 项目需求分析项目需求分析.-10 10-3.1 业务需求分析.-10-3.1.1 演出台本内容审核需求.-10-3.1.2 敏感内容比对标注需求.-10-3.1.3 敏感演员标签化管理需求.-10-3.2 安全需求分析.-10-3.2.1 整体安全需求.-10-3.2.2 访问控制需求.-11-3.2.3 传输加密需求.-12-3.2.4 防病毒系统需求.-12-3.2.5 应用安全需求.-12-3.2.6 数据库安全需求.-12-3.3 其他需求分析.-13-3.3.1 数据备份要求.-13-3.3.2 可扩展性要求.-13-3.3.3 易操作性要求.-14-3.3.4 异4、常处理要求.-14-第第 4 4 章章 项目建设方案项目建设方案.-14 14-4.1 系统整体设计.-14-4.1.1 系统总体架构.-14-4.1.2 系统网络拓扑图.-15-4.1.3 业务及数据流程.-16-4.24.2 技术路线分析技术路线分析.-17-4.2.14.2.1 关键技术应用关键技术应用.-17-4.2.24.2.2 核心技术指标核心技术指标.-21-4.3 系统详细设计.-22-4.3.1 AI 引擎能力.-22-4.3.2 演出市场内容监管智能系统.-24-4.3.3 用户登陆认证及密码应用.-31-4.4 信息保障方案.-34-4.4.1 数据安全及备份.-34-45、.4.2 应用安全.-34-第第 5 5 章章 项目实施进度项目实施进度.-3636-5.1 项目建设周期.-36-5.2 实施进度计划.-36-第第 6 6 章章 项目风险及控制措施项目风险及控制措施.-3737-6.1 项目实施的外部风险及控制措施.-37-6.2 项目实施的内部风险及控制措施.-37-6.3 项目长期运行风险及控制措施.-40-第第 7 7 章章 项目预算项目预算.-4343-7.1 资金估算总表.-43-7.2 软件拆分明细表.-46-7.3 硬件明细表.-48-第第 8 8 章章 项目效益项目效益.-51 51-8.1 促进审核监管智能化.-51-8.2 提升内容审核6、工作效率.-51-第第 1 1 章 项目概况章 项目概况1.1 1.1 项目名称项目名称XX-1-区文化和旅游管理事务中心演出市场内容监管智能系统项目1.21.2 项目单位项目单位XX区文化和旅游管理事务中心1 1.3 3 建建设设依依据据1 1.3 3.1 1 政政策策依依据据1.中共中央办公厅 国务院办公厅印发“十四五”文化发展规划;2.国务院营业性演出管理条例(2016 年修订版)(国务院令第 528号);3.文化和旅游部 “十四五”文化和旅游发展规划(文旅政法发 202140 号);4.文化和旅游部“十四五”文化和旅游科技创新规划(文旅科教发202139 号);5.文化和旅游部关于修改7、营业性演出管理条例实施细则的决定(中华人民共和国文化和旅游部令第 9 号);6.文化和旅游部关于深化“放管服”改革促进演出市场繁荣发展的通知(文旅市场发202062 号);7.推进上海生活数字化转型构建高品质数字生活行动方案(20212023 年);8.XX区全面推进城市数字化转型行动方案(2021-2023)。1.1.3.23.2-2-参考标准参考标准(1)信息安全技术个人信息安全规范(GB 35273-2020);(2)信息安全技术信息技术产品供应方行为安全准则(GB/T32921-2016);(3)计算机软件开发规范(GB8566-88);(4)计算机软件产品开发文件编制指南(GB8568、7-88);(5)计算机软件质量保证计划规范(GB/T12504-90);(6)计算机软件需求规格说明规范 GB/T9385-2008;(7)计算机软件测试文档编制规范 GB/T9386-2008;(8)计算机软件可靠性和可维护性管理 GB/T14394-2008;(9)计算机软件测试规范 GB/T15532-2008。1 1.4 4 建建设设背背景景“十三五”时期,社会主义核心价值观和中华优秀传统文化广泛弘扬,主流舆论不断巩固壮大,网络空间日益清朗,全国各族人民精神面貌更加奋发昂扬。文艺创作持续繁荣,公共文化服务水平不断提高,文化事业和文化产业繁荣发展,人民参与感、获得感、幸福感显著提升。“9、十四五”时期是我国在全面建成小康社会基础上开启全面建设社会主义现代化国家新征程的第一个五年,我国文化和旅游发展仍然处于重要战略机遇期,但机遇和挑战都有新的发展变化,满足人民日益增长的美好生活需要,需要顺应数字化、网络化、智能化发展趋势,以 5G 网络、人工智能、大数据、云计算、物联网、区块链等新一代信息技术为代表的新一轮科技革命和产业变革进一步深入发展,数字技术更加全面融入社会交往和日常生活,以智能化、数字化为目标的数字经济快速增长,构筑智慧便捷、全民畅享的美好数字生活新图景,已经成为广大人民群众美好生活新期待的重要内容-3-。习近平总书记考察上海、考察XX重要讲话和重要指示精神为XX区加快建10、设具有世界影响力的国际精品城区、推进城区社会主义现代化建设指明了方向,也为XX文旅发展带来了重大历史机遇。剧场演出活动作为促进文化产业的发展,繁荣社会主义文艺事业,满足人民群众文化生活的需要,促进社会主义精神文明建设的重要组成部分,在新技术环境下正面临着前所未有的机遇与挑战。在此背景下XX区文化和旅游管理事务中心以XX“数字文旅”为出发点,积极推动完善演出内容及活动审核机制,通过“机器审核+人工审核+质检回查”的有效审核机制,提升演出活动内容审核和现场监管能力,最大限度降低安全演出安全隐患,保护观众合法权益,维护演出市场健康发展,更好地满足人民群众多样化、多层次的精神文化需求。1.51.5 建11、设必要性建设必要性1.5.11.5.1 响应国家文化和旅游发展规划政策的需要响应国家文化和旅游发展规划政策的需要为进一步推进文化事业、文化产业和旅游业繁荣发展,根据中华人民共和国国民经济和社会发展第十四个五年规划和 2035 年远景目标纲要,2021 年 4 月,文化和旅游部印发“十四五”文化和旅游发展规划(文旅政法发202140 号),规划明确提出“开展平安文化市场建设,完善文化产品和服务内容审核机制,加强线上线完善文化产品和服务内容审核机制,加强线上线下内容审核及动态监测,加强演出、艺术品、网络表演、网络音乐、下内容审核及动态监测,加强演出、艺术品、网络表演、网络音乐、游戏游艺、歌舞娱乐行12、业内容源头治理游戏游艺、歌舞娱乐行业内容源头治理,发展积极健康的网络文化”。1.5.21.5.2 服务于上海服务于上海XXXX-4-区城市数字化转型的需要区城市数字化转型的需要根据推进上海生活数字化转型构建高品质数字生活行动方案(20212023 年)精神和XX区全面推进城市数字化转型行动方案(2021-2023 年)要求,XX区聚焦经济、生活和治理三大领域,通过健全工作机制、加强法治保障、强化政策支持、营造宣传氛围,分领域推进重点工作、重大项目和重要政策,积极探索对新经济业态实行更包容的审慎监管模式,加强应用牵引、数据赋能和关键支撑,打造具有示范效应的数字政务标杆场景。通过建设演出市场内容监13、管智能系统,赋能区域文化市场发展,在城市数字化转型上走在全市前列。1.5.31.5.3 强化重点演出内容审核和现场监管的需要强化重点演出内容审核和现场监管的需要2020 年 9 月,文化和旅游部出台关于深化“放管服”改革促进演出市场繁荣发展的通知,通知 强调“强化重点演出类型监管。对音乐节庆类演出活动,要重点对电音类、说唱类节目进行审核把关,加加强强对对演演出出现现场场显显示示屏屏内内容容以以及及互互动动环环节节的的监监督督检检查查。对对沉沉浸浸式式演演出出活活动动,要要加加强强演演出出全全流流程程审审核核,防防止止出出现现宣宣扬扬封封建建迷迷信信、淫淫秽秽色色情情及及渲渲染染血血腥腥暴暴力力14、等等内内容容。对对小小剧剧场场演演出出活活动动,要要重重点点加加强强脱脱口口秀秀、相相声声以以及及先先锋锋话话剧剧、实实验验话话剧剧等等语语言言类类节节目目的的内内容容审审核核和和现现场场监监管管”,促进演出市场繁荣发展,更好地满足人民群众多样化、多层次的精神文化需求,助力加快形成新发展格局。1 1.5 5.4 4 改改造造和和创创新新演演出出内内容容监监管管应应用用场场景景的的需需-5-要要在海量内容面前,单靠审核人员人工来把关越来越不现实:一方面,海量的内容审核带来的成本压力与日俱增。另一方面,人工审核的时效性无法满足现场演出等各种实时发布的需求,国家有关部门的监管力度在不断加大,要求越来15、越严,利用自然语言处理、语言识别等人工智能技术,AI 赋能演出内容监管应用场景,解决多语种审核障碍,自动提供各种内容的安全识别,大大改善了审核的时效性和效率,同时大幅降低了成本。1 1.6 6 建建设设目目标标1 1.6 6.1 1 激激发发城城市市公公共共空空间间的的文文化化活活力力为全面推进XX区数字化转型,聚焦生活数字化应用场景,响应市委办公厅、市政府办公厅印发的上海市社会主义国际文化大都市建设“十四五”规划中的任务,激发城市公共空间文化活力,实施基层公共文化设施“更新与提升计划”。1.6.21.6.2 助力演出内容监管智能化升级助力演出内容监管智能化升级利用自然语言处理、语言识别等人工16、智能技术,助力演出活动内容监管数字化和智能化转型升级,随着人工智能技术的不断成熟和数据的不断丰富,智能审核的算力瓶颈基本不再,计算能力的不断增强,持续优化模型提高精准度,智能审核的普及程度还将进一步提升。1 1.6 6.3 3 促促进进演演出出市市场场的的健健康康有有序序发发-6-展展通过提升演出活动内容审核和现场监管能力,最大限度降低演出安全隐患,保护观众合法权益,促进演出市场健康有序发展,更好地满足人民群众多样化、多层次的精神文化需求。1 1.7 7 整整体体规规划划本项目将以演出活动内容监管为目标,以语音识别转写、机器翻译、文本审核等技术能力为有效补充,以演出活动内容监审和监管信息化、数17、字化、智能化为支撑,整体规划建设XX区文化和旅游管理事务中心演出市场内容监管智能系统,规划通过 3-5 年的系统建设和技术探索,实现XX区的各个演出场所的演出活动信息及演员信息上传数据的统一管理,积极探索对新经济业态实行更包容的审慎监管模式,加强应用牵引、数据赋能和关键支撑,打造具有示范效应的数字政务标杆场景。通过建设演出市场内容监管智能系统,赋能区域文化市场发展,构建完整的产业服务链条,保障系统的运维及造血能力,进而为演出场所、监管部门及系统覆盖范围内的用户提供方便、高效、优质的智能监管数字化服务,在城市数字化转型上走在全市前列。其中:1、离线监审规划:本系统计划在投入第一年完成对XX区约 18、500 件的离线台本及演出人员监审进行服务支撑,每日处理 200 小时以上的音频转写量。首先对基于标准普通话及英语的话剧、脱口秀等场景达到 85%以上的文字转写、翻译准确率,以及 80%以上的台本敏感内容的识别准确率与 90%以上的敏感演出人员识别准确率-7-。在系统投入使用三年内,完成全区 3000 场演出活动监审,每日处理 250 小时以上的音频转写量。通过对语音模型的学习及敏感库的完善,基于标准普通话及英语的话剧、脱口秀等场景达到 90%以上的文字转写、翻译准确率,以及 85%以上的台本敏感内容的识别准确率与 93%以上的敏感演出人员识别准确率。在系统投入使用三年内,针对基于标准普通话及19、英语的歌曲场景能够具备初步转写能力,达到80%以上的文字转写准确率。在系统投入使用三年内,针对基于标准口音的日语等多语种在话剧、脱口秀等场景能够达到 80%以上的文字转写、翻译准确率。在系统投入使用五年内,通过对语音模型的学习及敏感库的完善,每日处理 300 小时以上的音频转写量。基于标准普通话及英语的话剧、脱口秀等场景达到 95%以上的文字转写、翻译准确率,以及 90%以上的台本敏感内容的识别准确率与97%以上的敏感演出人员识别准确率。在系统投入使用五年内,针对基于标准普通话及英语的歌曲场景能够具备较好的转写能力,达到 85%以上的文字转写准确率。在系统投入使用五年内,针对基于标准口音的日语20、等多语种在话剧、脱口秀等场景能够达到 85%以上的文字转写、翻译准确率。1 1.8 8 本本期期建建设设内内容容为全面推进XX区数字化转型,聚焦文旅数字化需求,以满足剧场演出场景内容转写翻译和音视频内容审核监管为导向,以人工智能-8-技术创新应用为手段,建设一套演出市场内容监管智能系统涵盖语音识别、机器翻译、文本分析共 3 大类基础能力,利用语音转写的 AI技术将语音信息转换成文字信息,语音转文字后系统自动匹配敏感关键词库,将匹配识别结果进行告警,让工作人员可以快速定位告警音视频位置和告警内容,为剧场运行提供内容智能审核服务,保护观众合法权益,维护演出市场健康发展,更好地满足区域内市民多样化、21、多层次的精神文化需求。1.8.11.8.1 部署部署一套语音识别及机器翻译引擎一套语音识别及机器翻译引擎基于先进的中英双语混合语音识别、深度神经网络机器翻译等人工智能技术,提供连续非实时转写及机器翻译能力,在演出剧本、语音审核场景下实现中英语音转文本及中英文本互译,降低内容审核监管成本,大幅提升人工审核效率。1.8.21.8.2 建立建立统一的演出活动内容监管统一的演出活动内容监管应用应用通过建设敏感内容信息库,对来自用户上传的音视频流及文件进行监管,满足演出活动业务场景下敏感内容、敏感演员的识别分析、告警,保障演出活动安全进行,主要功能包括敏感演出人员识别、语音转写、机器翻译、关键词预警和数22、据检索五大主要功能,另外,系统还支持关键词库管理、用户管理等辅助功能。1.8.31.8.3 提升音视频、台本离线审核能力提升音视频、台本离线审核能力基于客户端对历史音视频文件进行上传,文件支持 mp3、wav、avi、mp4 等主流音视频格式。将文件中的语音信息转换为文本信息,并与敏感内容库进行信息比对,基于客户端对台本文件进行上传,文件支持 doc、txt 等文档格式。将文件中的文本信息与敏感内容库进行信息比对,识别高风险语句、词汇,并将高风险内容予以高亮提示,支持在系统内对台本内容进行二次编辑并导出,导出格式支持 doc、txt 等文档格式。1 1.8 8.4 4 加加强强对对演演出出演演23、员员库库管管理理与与审审核核能能-9-力力基于客户端对涉敏演出人员进行上传,支持对敏感演员进行标签化管理;支持对每场演出人员信息进行标准化文档上传,上传格式支持 txt、doc、xls 等格式,内容包含演员名称、描述、身份信息等,对标准化信息进行分类存储并在系统中完成展示、检索、增加、删除、编辑功能;支持对上传的演出人员信息与涉敏演出人员进行数据库检索、比对,当出现重名、身份信息等数据维度重合时予以告警辅助工作人员进行演出脱敏流程干预。1 1.9 9 总总投投资资估估算算本项目总投资估算 158 万元,建设经费拟由中央补助地方公共文化服务体系建设专项资金支持。第第 2 2 章章 项项目目现现状24、状2 2.1 1 项项目目单单位位概概况况上海市XX区文化和旅游管理事务中心(上海市XX区文物管理事务中心)承担XX区文化和旅游市场管理、文物管理、资源开发和产业发展、以及文化和旅游公共服务宣传推广等工作。上海市XX区文化和旅游管理事务中心(上海市XX区文物管理事务中心)共有 6-10-个内设机构,包括:办公室、市场管理部、文物管理部、资源开发和产业发展部、公共服务部、信息化工作部。第第 3 3 章章 项目需求分析项目需求分析3.13.1 业务需求分析业务需求分析3.1.13.1.1 演出台本内容审核需求演出台本内容审核需求用户通过上传演出台本,系统自动将文件中的文本信息与敏感内容库进行信息比25、对,识别高风险语句、词汇,并将高风险内容予以高亮提示,减少台本审核工作量。3.1.23.1.2 敏感内容比对标注需求敏感内容比对标注需求通过建设敏感内容信息库,对来自采集终端的音视频流及文件进行监管,满足演出活动业务场景下敏感内容的分析、预警,保障演出活动安全进行。3.1.33.1.3 敏感演员标签化管理需求敏感演员标签化管理需求通过在客户端对涉敏演出人员进行上传,支持对敏感演员进行标签化管理,支持对上传的演出人员信息与涉敏演出人员进行数据库检索、比对,当出现重名、身份信息等数据维度重合时,向辅助工作人员告警提醒进行演出脱敏流程干预。3.23.2 安全需求分析安全需求分析3.2.13.2.1 26、整体安全需求整体安全需求目前信息系统在运行环境、身份识别、网络安全、数据安全、应用系统安全以及信息安全综合管理方面均需加强安全防护能力,避免-11-给整个信息系统带来严重安全威胁,尽可能的减少网络安全方面的隐患,保证网络的高性能、高稳定性及高可管理性。本平台需要严格遵照信息安全等级保护相关国家标准对信息系统进行分析整改并提供相应的等级保护安全服务。在开展信息安全等级保护安全建设整改工作中,按照国家有关规定和标准规范要求,坚持管理和技术并重的原则,将技术措施和管理措施有机结合,建立信息系统综合防护体系,提高信息系统整体安全保护能力。依据信息系统安全等级保护基本要求,落实信息安全责任制,建立并落实27、各类安全管理制度,开展人员安全管理、系统建设管理和系统运维管理等工作,落实物理安全、网络安全、主机安全、应用安全和数据安全等安全保护技术措施。本次项目建设按照等保二级安全保障措施进行建设实施。3.2.23.2.2 访问控制需求访问控制需求非法访问主要包括非法用户的非法访问、合法用户的非授权访问及假冒合法用户非法访问。非法用户的非法访问也就是黑客或间谍的攻击行为;合法用户的非授权访问是指合法用户在没有得到许可的情况下访问了他本不该访问的资源;假冒合法用户非法访问是指入侵者假冒合法用户的 IP 地址或用户名等对资源进行非法访问,这些非法访问都会对系统的安全性造成严重的损坏,因此,要采取一定的身份认28、证机制和访问控制手段,防范非法访问、入侵和攻击,严格控制只在合法用户才能访问合法资源。-12-3.2.33.2.3 传输加密需求传输加密需求加密传输是网络安全重要手段之一。信息的泄漏很多都是在链路上被搭线窃取,数据也可能因为在链路上被截获、被篡改后传输给对方,造成数据真实性、完整性得不到保证。如果利用加密设备对传输数据进行加密,使得在网上传的数据以密文传输。对数据传输过程中的完整性、真实性进行鉴别。可以保证数据的保密性、完整性及可靠性。因此,必需配备加密设备对数据进行传输加密。3.2.43.2.4 防病毒系统需求防病毒系统需求针对防病毒危害性极大并且传播极为迅速,必须配备从客户端到网关的整套防29、病毒措施,实现全网的病毒安全防护。3.2.53.2.5 应用安全需求应用安全需求随着互联网技术的迅猛发展,许多关键业务越来越多地基于 WEB应用,为满足这种对外连接不可信任网络的业务安全需求,应专门在计算服务器池内,为业务应用设立专用服务器进行 WEB 应用部署,并在前端添加安全防护。3.2.63.2.6 数据库安全需求数据库安全需求数据库安全是整个安全体系的重要组成部份,是信息安全保护的关键,数据库的安全需求主要有以下几方面:(1)账号集中管理系统需求账号集中管理系统,实现集中化帐号管理和身份验证,获得更高的控制能力和运行效率。实现整个帐户管理流程自动化,实现基于角-13-色的账户管理、策略30、执行、职能分工和管理权限委派等。可以对账号管理流程实现安全、可审核的内部控制。(2)数据库安全审计系统需求数据库安全审计系统是针对数据库的安全而提出的一种数据库操作审计产品,其基本思想是通过对网络数据的实时采集,以及对各种上层数据库通讯协议数据的实时分析和还原,对被监控网络中的数据库使用情况进行监控,对各种违规行为实时报告,甚至对某些特定的违规主机进行封锁,以帮助网络管理员对数据库资源进行有效的管理和维护。3.33.3 其他需求分析其他需求分析3.3.13.3.1 数据备份要求数据备份要求提供自动备份功能,支持全系统每天实行增量备份,定期实行全量备份并且备份结果可恢复。3.3.23.3.2 可31、扩展性要求可扩展性要求作为一个复杂的集中式应用系统,为多种类型的用户服务,技术实现时必须综合考虑系统的可靠性、高效性、安全性及业务发展的要求,也要适应和满足不同用户信息化发展的不同层次和水平,提供多样性的数据采集、接入和管理服务。要充分考虑技术体系发展前景,适应未来发展的需要。在设计时充分考虑系统对其它设备和技术的兼容性,系统应该适应业务发展和变革的需要,适应新增设备的变化。-14-3.3.33.3.3 易操作性要求易操作性要求针对系统易用性的具体要求:软件操作界面要清晰、简洁、便于操作和维护,尽量使用户能够不通过培训就可学会系统的使用。3.3.43.3.4 异常处理要求异常处理要求当系统出现32、致命异常,都要中止程序执行、回滚事务,应用程序自动记录异常前的正常数据,并以友好的方式提示用户,将错误信息写入日志,系统恢复后应可以查询或打开异常前的数据状态。第第 4 4 章章 项目建设方案项目建设方案4.14.1 系统整体设计系统整体设计4.1.14.1.1 系统总体架构系统总体架构本次项目整体架构可以分为应用层、生产能力层、AI 能力层、基础支撑层四个层面。应用层应用层:业务平台为各个应用场景提供模块化的能力,包括音视频转文字、敏感词库建设、敏感词预警、时码匹配、历史记录、意群翻译、文本翻译、音视频推流直播、演员管理等应用功能;-15-生产能力层生产能力层:平台层提供基础生产能能力,为业33、务应用提供能力支撑,包括用户管理服务、转写流程服务、音频推流转码服务、权限管理服务、任务及流程服务、翻译引擎适配服务、文件存储服务、敏感词检测能力;A AI I 能力层:能力层:中英混合非实时转写、中英机器翻译引擎、文本翻译;基础支撑层:基础支撑层:包括操作系统、网络、中间件、统一存储平台等。4.1.24.1.2 系统网络拓扑图系统网络拓扑图本项目网络架构分为剧场局域网、政务外网,监审客户端部署在剧场局域网,智能监审服务系统部署在政务内网中。1.剧场局域网:本系统中的客户端部署安装于剧场局域网中,使用剧场中的有线局域网,采用端口映射的方式将采集到的音视频数据传输至部署在政务外网的引擎服务器、应34、用服务器及存储服务器,进行音视频内容的非实时转写、敏感内容分析预警。2.政务外网:本系统中的语音非实时转写、机器翻译引擎及数据存储服务、应用服务部署于政务外网中,用户客户端通过访问政务云-16-外网进行直敏感预警数据的获取。4.1.34.1.3 业务及数据流程业务及数据流程1.用户登陆:用户通过账号/密码登陆方式对 PC 客户端进行登录访问。2.功能选择:用户选择离线监审/演员审查功能种类:2.1 离线监审:用户可通过创建离线台本监审任务对台本文档进行敏感内容校验,系统通过对后台敏感词库与文字内容进行对比,对出现的敏感内容进行高亮提示,用户可通过提示在任务内进行二次编辑,并对编辑完成的文件进行35、导出操作。2.2 演员审查:用户通过创建演员审查任务对演出人员进行文档上传或手动录入方式与敏感演员库进行校验,系统通过对后台敏感词库与文字内容进行对比,对出现的敏感内容进行高亮提示。3.任务管理:系统支持将离线监审、演员审查任务进行数据保存。用户可通过客户端对历史任务进行查看;历史离线任务进行编辑;历史音视频数据、历史敏感内容告警记录进行导出。-17-4.演员管理:用户选择敏感演员管理/历史演出人员管理功能种类:4.1 敏感演员管理:用户通过本模块对敏感演员信息进行维护,操作包含信息上传、检索、删除、编辑、导出。4.2 历史演出人员管理:敏感演员管理:用户通过本模块对历史演出演员信息进行维护,36、操作包含信息检索、删除、编辑、导出。4.24.2 技术路线分析技术路线分析4.2.14.2.1 关键关键技术技术应用应用4.2.1.14.2.1.1 语音识别语音识别语音转写与说话人无关,为自助语音终端提供连续语音识别功能。针对语音识别应用中面临的方言口音、背景噪声等问题,基于实际业务系统中所收集的涵盖不同方言和不同类型背景噪声的海量语音数据,通过先进的区分性训练方法进行语音建模,使语音识别在复杂应用环境下均有良好的效果表现。语音识别是与说话人无关的语音识别技术,为自助语音服务提供关键字语音识别功能。系统应具备优秀的识别率,提供全面的开发支持和易于使用的丰富的工具。-18-针对语音识别应用中面37、临的方言口音、背景噪声等问题,基于实际业务系统中所收集的涵盖不同方言和不同类型背景噪声的海量语音数据,通过先进的区分性训练方法进行语音建模,使语音识别器在复杂应用环境下均有良好的效果表现。系统应具备的特性:1)支持中文的常见语句听写语音识别对于日常使用的常用对话有着很高的识别准确率,包含短信类、生活、交通、娱乐、科技、数字数值、名人、互联网热词、新闻等领域,这些领域的整句识别正确率可以达到 97.5%以上。2)支持中文标点智能预测语音识别使用超大规模的语言模型,对识别结果语句智能预测其对话语境,提供智能断句和标点符号的预测。3)端点检测端点检测是对输入的音频流进行分析,确定用户说话的起始和终止38、的处理过程。一旦检测到用户开始说话,语音开始流向识别引擎,直到检测到用户说话结束。这种方式使识别引擎在用户在说话的同时即开始进行识别处理。4)噪音消除在实际应用中,背景噪声对于语音识别应用是一个现实的挑战,即便说话人处于安静的办公室环境,在语音中也难以避免会有一定的噪声。语音识别系统应具备高效的噪音消除能力,以适应用户在千差万别的环境中应用的要求。-19-5)大词汇量、独立于说话人的健壮识别功能满足大词汇量、与说话人无关的识别要求。产品可以支持数万条语法规模的词汇量,并能适应不同年龄、不同地域、不同人群、不同信道、不同终端和不同噪声环境的应用环境。前端语音处理前端语音处理指利用信号处理的方法对39、说话人语音进行检测、降噪等预处理,以便得到最适合识别引擎处理的语音。主要功能包括:(1)端点检测系统端点检测是对输入的音频流进行分析,确定工作人员说话的起始和终止的处理过程。一旦检测到工作人员开始说话,语音开始流向识别引擎,直到检测到工作人员说话结束。这种方式使识别引擎在工作人员在说话的同时即开始进行识别处理。(2)噪音消除系统在实际应用中,背景噪声对于语音识别应用是一个现实的挑战,即便说话人处于安静的办公室环境,在说话过程中也难以避免会有一定的背景噪声。语音识别系统应具备高效的噪音消除能力,以适应工作人员在不同环境中应用的要求。后端识别处理后端识别处理对说话人语音进行识别,得到最适合结果,主40、要特性有:(1)词汇识别系统满足大词汇量、与说话人无关的识别要求。可以支持数万条语法-20-规模的词汇量;并能适应不同年龄、不同地域、不同人群、不同信道、不同终端和不同噪声环境的应用环境。(2)多识别结果又称多候选技术,在某些识别过程中,识别引擎可以通过置信度判决的结果向应用程序返回满足条件的多个识别结果,而不是唯一的结果。识别系统提供了可能的识别结果列表,并按置信度结果从高到低进行排列。在业务设计中,可以根据应用要求向工作人员提供这些结果,供工作人员进行二次选择。通过置信度判决和多识别结果输出技术可以开发更加灵活、更加人性化的业务流程。(3)热词识别系统热词识别使得语音识别应用程序能够在说话41、者说话的同时检测一个特定的词或短语。(4)智能调整识别系统系统能够自动根据系统运行情况动态调整语音识别策略,在系统较忙时(CPU 占用较高),采用计算量较小但具有足够精度的策略以保证系统的响应速度;在系统不忙时(CPU 占用较低),采用精度更高的策略以达到更优的识别效果。该功能在保障稳定运行的基础上,充分利用系统的计算资源,有利于保护客户的设备投资。4.2.1.24.2.1.2 机器翻译机器翻译翻译处理引擎采用的是机器翻译技术,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程,由资源数据、-21-数据加工、模型训练、引擎构建及应用服务五个部分构成。为保障翻译的整体效果42、,统计机器翻译系统需要依赖于大规模数据支撑,为此在语音采集、标注、以及文本训练几个方向需要开展持续性的工作。基于 NMT 翻译框架,翻译服务采用了国际上领先的翻译技术,通过整合注意力网络机制和循环神经网络,完美模拟人脑翻译的机制,生成流畅的译文,支持中英、英中等多种语言互译模式。4.2.24.2.2 核心技术核心技术指标指标1.1.系统响应指标系统响应指标 系统应保证实时性,提供多用户、多任务操作,对用户的查询请求、语音识别等操作有较快响应。响应时间:常规页面操作的响应时间200 毫秒。2.2.语音识别转写指标语音识别转写指标 安静环境场景下,标准中文普通话转写准确率90%;通用场景下,清晰 43、Native 英语转写准确率85%;语音转写速度200ms。3.3.机器翻译指标机器翻译指标 中英互译 BLEU 值评分平均值55 分;通用口语的机器翻译忠诚度和流利度人工评价均可达到 4.0分以上(满分 5 分)。-22-4.34.3 系统详细设计系统详细设计4.3.14.3.1 AIAI 引擎能力引擎能力4.3.1.14.3.1.1 非实时中英转写引擎非实时中英转写引擎系统提供非实时中英转写引擎实现对普通话或英语连续语音的非实时转写,并提供对已转写文字的后处理及字音同步对齐能力,每天处理 360 小时的音视频。前端语音处理前端语音处理指利用信号处理的方法对说话人语音进行检测、降噪等预处理,44、以便得到最适合识别引擎处理的语音。主要功能包括:(1)端点检测系统端点检测是对输入的音频流进行分析,确定工作人员说话的起始和终止的处理过程。一旦检测到工作人员开始说话,语音开始流向识别引擎,直到检测到工作人员说话结束。这种方式使识别引擎在工作人员在说话的同时即开始进行识别处理。(2)噪音消除系统在实际应用中,背景噪声对于语音识别应用是一个现实的挑战,即便说话人处于安静的会场环境中,在说话过程中也难以避免会有一定的背景噪声。语音识别系统应具备高效的噪音消除能力,以适应工作人员在不同环境中应用的要求。后端识别处理后端识别处理对说话人语音进行识别,得到最适合结果,主要特-23-性有:(1)词汇识别系45、统满足大词汇量、与说话人无关的识别要求。可以支持数万条语法规模的词汇量;并能适应不同年龄、不同地域、不同人群、不同信道、不同终端和不同噪声环境的应用环境。(2)置信度输出置信度反映了识别结果的可信程度。语音识别引擎可以在返回识别结果时会携带该识别结果的置信度,应用程序可以通过置信度的值进行分析和后续处理。(3)多识别结果又称多候选技术,在某些识别过程中,识别引擎可以通过置信度判决的结果向应用程序返回满足条件的多个识别结果,而不是唯一的结果。识别系统提供了可能的识别结果列表,并按置信度结果从高到低进行排列。在业务设计中,可以根据应用要求向工作人员提供这些结果,供工作人员进行二次选择。通过置信度判46、决和多识别结果输出技术可以开发更加灵活、更加人性化的业务流程。(4)热词识别系统热词识别使得语音识别应用程序能够在说话者说话的同时检测一个特定的词或短语。-24-4.3.1.24.3.1.2 中英文机器翻译引擎中英文机器翻译引擎提供对中英语音的翻译处理,引擎采用的是机器翻译技术,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程,由资源数据、数据加工、模型训练、引擎构建及应用服务五个部分构成。为保障翻译的整体效果,统计机器翻译系统需要依赖于大规模数据支撑,为此在语音采集、标注、以及文本训练几个方向需要开展持续性的工作。致力于利用人工智能技术解决语言带来的沟通障碍,降低沟47、通翻译成本。4.3.24.3.2 演出市场内容监管智能系统演出市场内容监管智能系统4.3.2.14.3.2.1 用户管理模块用户管理模块通过系统后台对用户账号、密码进行集中化管理,支持用户的增、删、改、查,并将用户密钥数据与政务云密码服务进行同步,保障系统的用户数据受政务云统一监管。主要功能如下:4.3.2.1.14.3.2.1.1 图表用户管理图表用户管理图表形式的用户管理功能,主要按照产品维度进行用户信息展示。默认以图表形式进行展示。页面包含信息有 title 信息、面包屑导航、用户登录时欢迎词、用户管理模块,主要用于展示已添加的用户账号以及拥有的功能权限与具体权限。页面存在与列表形式用户48、管理的切换入口,可切换至列表形式。4.3.2.1.24.3.2.1.2 列表用户管理列表用户管理列表形式的用户管理功能,主要按照以用户维度进行用户信息展示。页面包含信息有 title 信息、面包屑导航、用户登录时欢迎词、-25-用户管理模块,主要用于展示已添加的用户账号以及拥有的功能权限与具体权限。页面存在与图表形式用户管理的切换入口,可切换至图表形式。4.3.2.1.34.3.2.1.3 角色管理角色管理主要用于展示已经添加的角色信息以及对应角色的权限,可对角色信息进行新增、修改、详情查看等功能。4.3.2.1.44.3.2.1.4 权限管理权限管理可对框架内各系统权限进行管理,新增、删除、49、修改以及查看系统权限列表信息。4.3.2.1.54.3.2.1.5 用户登录用户登录支持 chrome 浏览器或 IE 浏览器的 B/S 架构登录界面,账号密码登录模式。系统含默认账号和密码,并默认记住账号。登录成功则跳转至首页,失败时对失败原因进行提示。4.3.2.1.64.3.2.1.6 用户锁定用户锁定系统安全功能,如果在指定时间内登录失败达到一定的次数,该功能将根据安全策略锁定设置锁定用户帐户。已锁定的帐户将不能登录。4.3.2.1.74.3.2.1.7 修改密码修改密码修改密码以弹窗形式展示,仅登录状态下可进行。密码规则为6-20 个字符,由“英文大小写、数字、特殊符号”组成,密码不50、能少于 6 位,修改成功或失败均提示对应信息。-26-密码修改成功后需重新登录验证,包含自动 5s 倒计时跳转以及手动点击跳转至登录两种模式。4.3.2.1.84.3.2.1.8 密码过期密码过期组策略限制,使密码含有使用期限,超出期限则不可使用。4.3.2.1.94.3.2.1.9 退出登录退出登录隐私保护及账户切换时使用,点击后退出当前帐户,页面返回至登录界面。4.3.2.1.104.3.2.1.10 机构管理机构管理按照机构的层级关系显示结构信息,提供进入详情页,编辑以及删除功能,同时在不同层级权限下提供新增子节点的权限信息功能,具体分为机构列表、新增权限、机构信息编辑、机构信息查看等模51、块,均为单独的页面。4.3.2.24.3.2.2 离线监审模块离线监审模块4.3.2.2.14.3.2.2.1 台本审核任务创建台本审核任务创建支持创建离线监审任务、上传 txt、doc 等格式的本地台本文件创建任务,支持对任务名称进行自定义修改。4.3.2.2.24.3.2.2.2 音视频审核任务创建音视频审核任务创建支持创建离线监审任务、上传 mp3、wav、avi、mp4 等格式的本地台本文件创建任务,支持对任务名称进行自定义修改。-27-4.3.2.2.34.3.2.2.3 音视频文件转写音视频文件转写支持将上传的音视频文件数据进行语音转文本;支持通过语义分析将文本根据语义进行逐句拆分52、;支持对拆分的文本内容逐句对应在音视频中出现的时间码。4.3.2.2.44.3.2.2.4 中中、英文翻译英文翻译支持将英文文本翻译为中文文本内容。4.3.2.2.54.3.2.2.5 敏感内容识别敏感内容识别支持将文本内容与敏感信息库中的数据进行涉黄、涉恐、涉暴、涉政等敏感内容比对。4.3.2.2.64.3.2.2.6 敏感内容告警敏感内容告警支持对识别到的敏感内容在文本中进行标签化提示,并对出现敏感内容的予以高亮显示,支持将高亮的文本进行修改、删除、无错取消高亮等操作。4.3.2.2.74.3.2.2.7文本编辑文本编辑支持对上传的文件台本进行二次编辑操作。4.3.2.2.84.3.2.253、.8 敏感内容标注敏感内容标注支持在文本审核编辑过程中对敏感内容数据进行添加;支持将添加的敏感内容在文本内容进行标注;支持对手动标注过的数据进行归档;支持在后续任务中对已归档的敏感标注在出现相似文本内容时进行告警。-28-4.3.2.2.94.3.2.2.9 文件导出文件导出支持对二次编辑后的文本进行导出,导出格式支持 txt、doc 等格式。4.3.2.34.3.2.3 历史任务管理模块历史任务管理模块系统支持将离线监审任务与在线监审任务在政务云服务器进行保存,用户可随时查询、查看并下载历史任务数据。主要功能如下:4.3.2.3.14.3.2.3.1 任务分类导航任务分类导航支持将历史发起的54、离线监审、在线监审任务根据任务类型、任务发起时间、任务结束时间、任务创建人等维度进行列表化展示、排列。4.3.2.3.24.3.2.3.2 任务检索任务检索支持对历史任务通过关键词对任务名、任务发起人等进行文字键入检索并筛选相关任务。4.3.2.3.34.3.2.3.3 任务查看任务查看支持对历史任务进行查看,离线监审任务支持对历史任务文本进行二次修改、导出,在线监审支持对敏感内容及出现的时间点进行对齐,并支持定位播放。4.3.2.3.44.3.2.3.4 任务删除任务删除支持对历史任务进行删除,删除后历史任务及关联数据在后端进行同步删除。4.3.2.3.54.3.2.3.5 任务数据导出任务55、数据导出支持对在线监审任务中的历史音视频数据及触发的敏感词告警数据进行导出,音频数据支持 wav、mp3 格式,视频数据支持 mp4 格-29-式,告警数据支持 txt、doc 格式;支持对离线监审任务的台本数据及触发的敏感词告警数据进行导出,支持 txt、doc 格式。4.3.2.44.3.2.4 演员库管理与审查模块演员库管理与审查模块4.3.2.4.14.3.2.4.1 敏感演员库分组创建敏感演员库分组创建支持对敏感演员进行组创建;支持对敏感演员组进行增、删、改、查。4.3.2.4.24.3.2.4.2 敏感演员信息上传敏感演员信息上传支持对敏感演员信息进行文档上传,支持 txt、doc56、xls 格式;支持对敏感演员信息进行手动录入上传。4.3.2.4.34.3.2.4.3 敏感演员信息检索敏感演员信息检索支持通过文本录入方式对敏感演员信息进行检索匹配。4.3.2.4.44.3.2.4.4 敏感演员信息删除敏感演员信息删除支持对已录入的敏感演员信息进行删除。4.3.2.4.54.3.2.4.5 敏感演员信息编辑敏感演员信息编辑支持对已录入的敏感演员信息进行编辑。4.3.2.4.64.3.2.4.6 演出人员信息库分组创建演出人员信息库分组创建支持对演出演员进行组创建;支持对演出演员组进行增、删、改、查。-30-4.3.2.4.74.3.2.4.7 演出人员信息上传演出人员信息57、上传支持对演出演员信息进行文档上传,支持 txt、doc、xls 格式;支持对演出演员信息进行手动录入上传。支持上传信息存储在后端数据库中。4.3.2.4.84.3.2.4.8 演出人员信息检索演出人员信息检索支持通过文本录入方式对演出演员信息进行检索匹配。4.3.2.4.94.3.2.4.9 演出人员信息删除演出人员信息删除支持对已录入的演出演员信息进行删除。4.3.2.4.104.3.2.4.10 演出人员信息编辑演出人员信息编辑支持对已录入的演出演员信息进行编辑。4.3.2.4.114.3.2.4.11 演出人员涉敏预警演出人员涉敏预警支持对上传完毕的演出人员与敏感演员信息进行对比;支持58、对出现与敏感演员信息重合的演出人员在系统进行告警提示。4.3.2.4.124.3.2.4.12 敏感演员信息导出敏感演员信息导出支持对已录入的敏感人员信息进行导出;导出格式支持 txt、doc、xls。4.3.2.4.134.3.2.4.13 演出人员信息导出演出人员信息导出支持对已录入的演出人员信息进行导出;导出格式支持 txt、doc、xls。4.3.2.54.3.2.5 关键词库管理关键词库管理通过系统后台对监审系统的敏感词进行统一管控;用户可将敏感词根据词汇归属的类别及严重程度进行标签化、分组化管理,并能够-31-对任以敏感词所在组及单一敏感词进行增、删、改、查操作。主要功能如下:4.59、3.2.5.14.3.2.5.1 敏感词新增敏感词新增支持对敏感词进行导入,支持手动录入、文件批量录入;支持txt、doc 等文件格式上传。4.3.2.5.24.3.2.5.2 敏感词检索敏感词检索支持对已上传的敏感词通过关键字文本键入方式进行检索。4.3.2.5.34.3.2.5.3 敏感词修改敏感词修改支持对已上传的敏感词进行二次修改。4.3.2.5.44.3.2.5.4 敏感词删除敏感词删除支持将已上传的敏感词进行删除操作。4.3.2.5.54.3.2.5.5 敏感词分类管理敏感词分类管理支持将敏感词通过分级分类的方式进行归类管理,如涉政敏感词、涉恐敏感词等。4.3.34.3.3 用户登60、陆认证及密码应用用户登陆认证及密码应用1.单点登录(sso)本系统采用单点登录方式进行身份验证,单点登录,即用户只登录一次,在其随后访问所有的授权的资源时,都不需要再次登录。本方案使用 CAS 产品为基础来实现。2.基础设施安全事项与 CAS 服务器的所有通信通过安全通道进行(即 TLSv1)。这一要求有两个主要理由:-32-1身份验证过程需要传输安全凭据。2CAS 门票授予票是一个无记名令牌。所有从 CAS 服务器到应用程序的所有连接都将使用 HTTPS 完成:当生成的服务票据在“服务”网址上发送回应用程序时;当调用代理回调 URL 时。3.强制身份验证CAS 协议支持通过续订参数强制身份验61、证。强制身份验证为 SSO会话主体的身份提供了额外的保证,因为用户必须在访问之前验证其凭据。强制身份验证适用于需要或强制要求更高安全性的服务。通常,强制身份验证是按每个服务配置的,但服务管理设施为作为集中安全策略实现强制身份验证提供了一些支持。强制身份验证可以与多因素身份验证功能相结合,以实现任意服务的访问控制策略。4.被动身份验证CASv2 和 CASv3 协议通过网关功能支持此功能。被动身份验证补充了强制身份验证;当强制身份验证需要身份验证才能访问服务时,被动身份验证允许服务访问,尽管是匿名的,而无需身份验证。5.代理身份验证CASv2 和 CASv3 协议支持代理身份验证,并由服务代表用62、户请求的代理票据进行中介;因此,服务代理为用户进行身份验证。代理身份验证通常用于服务无法与用户直接交互的情况,并作为重播服务最终用户凭据的替代方案。6.SSO Cookie 加密-33-票据授予 cookie 是 CAS 在建立单个登录会话时设置的 HTTPcookie。默认情况下,cookie 值通过 CAS 属性中定义的设置进行加密和签名。7.密码管理安全链接帐户密码重置请求通过发送到用户注册电子邮件地址的安全链接进行处理。该链接仅在规定的时间范围内可用,并且请求由 CAS 正确签名和加密。8.协议票据加密由 CAS 发行并与服务票据等其他应用程序共享的协议票据可以选择通过签名/加密过程。63、9.密码管理如果身份验证因密码策略被拒绝而失败,CAS 可以拦截该请求,并允许用户更新帐户密码。可以随时将 CAS 重定向到使用一个独立应用程序,该应用程序完全负责管理帐户密码和相关流程。CAS 允许用户自愿重置密码。忘记帐户密码的人可能会在注册的电子邮件地址和/或电话上收到带有基于时间的到期政策的安全链接。该链接将允许用户提供他/她预定义的安全提示问题的答案,如果成功完成,将允许用户下次重置密码并重新登录。可以为可接受的密码指定模式。默认情况下,用户成功更改密码后,他们将被重定向到登录屏幕以输入新密码并登录。CAS还可以配置为在成功更改后自动登录用户。可以通过 CAS 设置更改此行为。-3464、-4.44.4 信息保障方案信息保障方案4.4.14.4.1 数据安全及备份数据安全及备份数据安全本项目所建系统的特定关键数据在存储方面采用了加密传输的方式。设计中可针对单系统进行独有密码的方式管理,且该方式与授权文件相关,保障不同系统之间的加密密钥不一样,从而限定即使在拿到其它系统的数据也无法进行使用。对于用户的数据,若无用户的明示授权,按照如下原则设计:1、在获得用户授权之前,不对用户数据进行增、删、改、查等操作;2、获得用户授权之后,对用户数据进行增、删、改、查等操作均进行日志记录,日志至少保存半年。数据备份特定关键数据采用了三副本方式进行数据存储备份,在相应单节点服务器出现故障时,能保65、障数据的完整性,保障数据不丢失。4.4.24.4.2 应用安全应用安全身份鉴别系统的对外 API 接口采用了 https 和 token 认证两大身份鉴别的调用的方式。Https:系统的安全等级分为二个级别,分别是第一级别是 http,第二级别是单向 Https(需服务端 CA 证书单向验证)。-35-Token 认证:在调用系统的 API 接口时,需在系统运维界面中添加对应用户名,系统会自动生成一个 Token(Acess_Secret 和Acess_Key),第三方调用接口时需带有对应系统分配的 Token 才能被允许。访问控制系统的账户支持授权用户管理所有帐户,包括添加、修改、和删除帐户66、,分配不同角色的使用权限。安全审计系统具有安全审计功能(审计账户)。审计内容包含用户行为、系统资源的异常使用和重要系统命令的使用等系统内重要的安全相关事件,审计所知事件的日期、时间、类型、主体标识等,并以以审计日志的方式进行记录。-36-第第 5 5 章章 项目实施进度项目实施进度5.15.1 项目建设周期项目建设周期本项目建设周期约为 6 个月。5.25.2 实施进度计划实施进度计划本项目建设分为深化设计阶段、系统建设阶段、测试与试运行阶段及验收阶段,培训工作贯穿于项目建设的全过程。1、深化设计阶段时间计划:1 个月主要任务:项目总体需求分析、根据具体需求进行系统结构设计、总体框架设计、系统67、软硬件设备购置和部署等。2、系统建设阶段时间计划:3 个月主要任务:在完成总体规划阶段的基础上,根据总体设计方案,进行网络、应用、安全等建设实施的过程。其中应用系统在逻辑上包含众多业务,根据这些业务的内在关系,并考虑整个信息化工作的均衡局面,采用分阶段,有重点的原则进行逐步建设,优先建设技术成熟以及基础核心的应用子系统。3、系统试运行阶段时间计划:1 个月-37-主要任务:测试工作要在整个项目工程的后期实施,主要目的是对项目的结果做总体评估。测试的依据是项目初期制定的相关技术指标、功能指标以及额外指标。如果在测试中所有的指标全部合格,测试工作就此结束。如果有部分指标不合格,则需要对某些指标重测68、一次,对未达到指标的系统进行检查,找出问题,解决问题并最终达到指标。4、验收阶段时间计划:1 个月主要任务:当系统实施完成并经过测试合格后,可以进行验收。对验收过程中发现问题的处理方法以及对它们的处置,应该予以重视并解决。第第 6 6 章章 项目风险及控制措施项目风险及控制措施6.16.1 项目实施的外部风险及控制措施项目实施的外部风险及控制措施协调风险:是对目标的期望和认同不一致,责任不对称,信息不对称,文化意识和沟通上的矛盾。在进行项目建设时候需要进行多业务部门的协调,保持信息的对称,防止由于信息不对称及其它因素而导致各业务不能相互配合进行项目建设,使项目建设无法达到预定目标,产生协调性风69、险。6.26.2 项目实施的内部风险及控制措施项目实施的内部风险及控制措施根据项目的实际情况,通过有效的分析与研究,该项目主要内部风险包括以下几个方面:-38-认识风险:由于项目建设没有统一的标准,各地根据自身情况形成了不同的模式,难以真正把握项目建设的本质和发展规律,使得许多人对项目产生了简单和片面的认识,导致出现脱离现实条件、忽视风险、盲目建设等问题。为了更好的进行项目建设,就必须在认识上避免上述问题,把项目的建设作为一个系统工程来考虑,认真合理地制订建设方案和实施计划,减少认识风险。规划风险:规划是信息化建设的基础的工作。由于对信息化认识的局限性以及目前的行政体制和投融资体制等原因,相当70、部分的项目在进行总体规划时候,项目设计出现一定的偏差,不能统筹各类信息化资源,使建成的项目相关性、集成度存在不足,为项目的后续实施带来了一定的风险。执行过程产生的风险:这类风险包括:人员的组合不恰当与变动造成团队不稳定,双方的信息沟通问题,实施过程遇到意外问题,实施与运营没有很好交接等。项目实施过程是各种矛盾和问题不断产生和解决的过程。由于规划设计的不足、相关主体利益的冲突、高素质的信息人才的缺少、财务控制的困难、工程质量监理、信息不对称等任何一种的原因,都可能造成项目实施的失败。对于项目的建设,必须与相关应用系统建设相结合,因此在实施过程,需要大量的协调工作,需要建立有效的实施管理体系和协调71、机制,需要配备高素质的信息化管理人员,否则,将难以有效化解实施过程的风险。随着项目的投入运行,各具体功能的应用规模必将大幅提升。因此该项目在实施时制定的数据保存和交换接口的兼容程度也将对该-39-项目的成败至关重要。为了保护投资,延长该项目的使用寿命,该项目在定义数据交换接口时,必须具备科学性、先进性、前瞻性和可扩展性,使得项目能够以最小的投入无缝地集成。本项目的规划和实施计划从以下几个方面尽可能的将项目的内部风险降到最低,具体控制措施如下:1)提高认识,正确定位,目标清晰充分估计项目建设的困难和风险,做好需求分析,研究并做好相关行政资源的配套;树立长期的持续发展和分阶段实施有限目标的观点,在72、总体目标下,分阶段实施有限目标,并进一步做好目标之间、项目之间的关联和集成。2)做好前期规划在前期引进专业咨询公司和人员,内部又从各个业务部门抽调业务人员组成项目建设小组,为项目的规划、咨询、论证、决策和实施提供依据和帮助。对项目的建设,项目建设小组经过非常细致的需求调研后,编写了信息化规划,并参照了其它项目建设经验,广泛征求信息化专家,领导意见的基础上,经过反复讨论和修改,完成了项目可行性研究报告的撰写,目的就是通过实施前的项目建设分析,规避实施风险,减少项目建设过程中由于项目设计的原因带来的损失,保证项目实施的顺利进行,达到项目建设的预定目标。3)建立管理体系,加强项目管理加快建立围绕项目73、的管理体系,具体包括项目咨询设计机构、项目建设监理机构、项目性能测试单位、项目资金概算决算审核小组、-40-项目技术评审机构、系统安全测评机构等,组织这些机构从不同的环节实施对项目的管理,保障项目建设、应用、运行、安全、资金等方面的工作;要控制投资规模,小步稳步推进,努力克服不计成本的技术化倾向,盲目追求技术和设备的先进性。4)严格进行供应商,集成商选择选择合适的服务供应商也是信息化项目建设中的关键性问题。选择合适的服务供应商,可能使项目进度加快,事半功倍。在项目建设中,除了项目建设之外,还需要对供应商、集成商的选择上需要进行严格筛选。6.36.3 项目长期运行风险及控制措施项目长期运行风险及74、控制措施根据项目的实际情况,通过有效的分析与研究,该项目长期运行的风险包括以下几个方面:安全风险:当前应用系统安全运行环境趋于恶化,遭到恶意破坏的几率越来越大。由于缺少资金和人才,信息安全技术和设备很难达到安全要求;在管理方面,安全管理制度还有待建立和完善,又缺少应急处理预案,因此安全的风险较大。系统的任何安全事故,都将造成严重损失和恶劣影响。对于此项目,必须重点考虑项目的安全防护,安全维护,将信息安全问题作为一个重要的项目成败的关键因素考虑,加大信息安全方面的建设。管理风险:本项目作为一个信息化建设项目,其生命周期贯穿着项目规划设计、实施建设、可靠运行、直至报废的全过程,是实施有效管理的过程75、。需要管理的内容有规划管理、过程管理、技术管理、-41-安全管理、运行维护管理、质量管理、资金管理、成本管理等方面,同时还要加强人员管理、信息资源管理以及各种协调事项和各类风险控制。对于项目,随着系统的建设和应用规模的不断扩大,管理的难度和风险还将不断加大。本项目的规划和实施计划从以下几个方面尽可能的将项目的长期运行风险降到最低,具体控制措施如下:1.重视项目建设的灵活性及可扩展性,采用主流成熟技术和设备建设过程中充分考虑长期运行要求,处理好技术和系统的上下左右关系,保证系统可升级、灵活、安全与信息开发相结合,也就是说要考虑技术(如开发工具)的发展趋势,与其他工具、软件开发的协作性,以及整个系76、统的可持续发展性和与外部的合作能力。同时,技术是否成熟是决定系统稳定运行的重要因素之一,在对项目进行规划和设计时,始终坚持的原则之一就是采用信息化建设主流技术进行项目设计,避免进行采用不成熟的技术进行建设;主流技术成熟可靠,减少了由于采用新技术而带来的运行风险;同时,项目建设坚持可靠,稳定,易实施的思想,避免一味追求高新技术而出现运行问题。2.做好项目运行维护人才储备,加强培养培训专业人才为保障项目的运行维护,应加快培养专业技术人是提高系统运行效率、降低运行风险的有效措施,以减少项目运行中由于技术和人才的不足而导致项目不能平稳运行情况。3.建立项目运维标准体系-42-按照应用系统运行维护相关体77、系标准,进行项目运行维护,制定项目故障修复和紧急处理预案,明确运行维护的责任,定期做好系统安全测试和运行效果评估。-43-第第 7 7 章章 项目预算项目预算7.17.1 资金估算总表资金估算总表序号序号类别类别小计(元)小计(元)备注备注1 1、AIAI 引擎能力引擎能力1非实时中英文转写引擎¥250,000.00实现对普通话连续混合语音的非实时转写,并提供对已转写文字的后处理及字音同步对齐能力,单套引擎支持每日360 小时音视频处理能力,主要指标应满足:1、安静环境场景下,标准中文普通话转写准确率90%;2、通用场景下,清晰 Native 英语转写准确率85%;3、语音转写速度200ms。78、2中英文机器翻译引擎¥250,000.00中英智能机器翻译引擎,实现对中英连续语音的翻译。提供对中英语音的翻译处理,引擎采用的是机器翻译技术,是利用计算机将一种自然语言(源语言)转-44-换为另一种自然语言(目标语言)的过程,由资源数据、数据加工、模型训练、引擎构建及应用服务五个部分构成。主要指标应满足:中英互译 BLEU 值评分平均值55 分;通用口语的机器翻译忠诚度和流利度人工评价均可达到 4.0 分以上(满分 5分)。2 2、软件定制开发、软件定制开发1演出市场内容监管系统940,000.001、用户管理模块:通过系统后台对用户账号、密码进行集中化管理,支持用户的增、删、改、查,并将用户79、密钥数据与政务云密码服务进行同步,保障系统的用户数据受政务云统一监管。2、离线监审模块:系统支持用户通过在客户端中上传中、英台本文档后,识别文档中存在的敏感信息并予以标注,并同时支持用户对内容进行二次编辑-45-与导出。3、历史任务模块:系统支持将离线监审任务与在线监审任务在政务云服务器进行保存,用户可随时查询、查看并下载历史任务数据。4、演员库管理与审查模块:通过在客户端对涉敏演出人员进行上传,支持对敏感演员进行标签化管理,支持对上传的演出人员信息与涉敏演出人员进行数据库检索、比对,当出现重名、身份信息等数据维度重合时,向辅助工作人员告警提醒进行演出脱敏流程干预。5、关键词库管理:通过系统后80、台对监审系统的敏感词进行统一管控;用户可将敏感词根据词汇归属的类别及严重程度进行标签化、分组化管理,并能够对任以敏感词所在组及单一敏感词进行增、删、改、查操作。-46-3 3、二类费用、二类费用1软件测评费80,000.00软件测评费2安全测评费30,000.00安全测评费3项目监理费30,000.00项目建设费总计(元)总计(元)1 1,580580,00000.0.0 00 07.27.2 软件拆分明细表软件拆分明细表序号序号功能模块功能模块数量数量单位单位单价单价小计(元)小计(元)一、演出市场内容监管智能系统(服务端)一、演出市场内容监管智能系统(服务端)1用户管理模块用户管理模型机构81、构建0.5人/月¥20,000¥10,0002用户管理模型用户列表构建0.5人/月¥20,000¥10,0003用户管理模型角色管理构建0.5人/月¥20,000¥10,0004用户登陆、退出、修改密码、密码生命周期设置功能0.5人/月¥20,000¥10,0005离线监审模块台本审核任务创建1.5人/月¥20,000¥30,0006音频审核任务创建1.5人/月¥20,000¥30,0007音视频文件转写1人/月¥20,000¥20,0008中、英文翻译1人/月¥20,000¥20,0009敏感内容离线识别1人/月¥20,000¥20,00010敏感内容离线告警1人/月¥20,000¥20,082、0011文本编辑1人/月¥20,000¥20,00012敏感内容标注2人/月¥20,000¥40,00013文件导出0.5人/月¥20,000¥10,00014演员库管理与审查模块敏感演员库分组创建0.5人/月¥20,000¥10,00015敏感演员信息上传0.5人/月¥20,000¥10,00016敏感演员信息检索0.5人/月¥20,000¥10,00017敏感演员信息删除0.5人/月¥20,000¥10,00018敏感演员信息编辑0.5人/月¥20,000¥10,00019演出人员信息库分组创建0.5人/月¥20,000¥10,00020演出人员信息上传0.5人/月¥20,000¥10,083、00-47-21演出人员信息检索0.5人/月¥20,000¥10,00022演出人员信息删除0.5人/月¥20,000¥10,00023演出人员信息编辑0.5人/月¥20,000¥10,00024演出人员涉敏预警1人/月¥20,000¥20,00025敏感演员信息导出0.5人/月¥20,000¥10,00026演出人员信息导出0.5人/月¥20,000¥10,00027历史任务管理模块任务分类导航1.5人/月¥20,000¥30,00028任务检索0.5人/月¥20,000¥10,00029任务查看0.5人/月¥20,000¥10,00030任务删除0.5人/月¥20,000¥10,0003184、关键词库管理敏感词新增0.5人/月¥20,000¥10,00032敏感词检索0.5人/月¥20,000¥10,00033敏感词修改0.5人/月¥20,000¥10,00034敏感词删除0.5人/月¥20,000¥10,00035敏感词分类管理1.5人/月¥20,000¥30,000小计(元)小计(元)¥5 52 20,0000,000二、演出市场内容监管智能系统(客户端)二、演出市场内容监管智能系统(客户端)1用户管理模块图表用户管理主界面0.5人/月¥20,000¥10,0002列表用户管理主界面0.5人/月¥20,000¥10,0003角色管理界面0.5人/月¥20,000¥10,000485、权限管理界面0.5人/月¥20,000¥10,0005用户登录、退出、锁定界面0.5人/月¥20,000¥10,0006密码管理界面0.5人/月¥20,000¥10,0007机构管理界面0.5人/月¥20,000¥10,0008离线监审模块台本监审主界面1人/月¥20,000¥20,0009音频审核任务创建页面1人/月¥20,000¥20,00010音视频文件转写结果页面1人/月¥20,000¥20,00011任务上传界面0.5人/月¥20,000¥10,00012文本结果编辑界面1人/月¥20,000¥20,00013翻译内容编辑界面1人/月¥20,000¥20,00014敏感内容标注页面186、人/月¥20,000¥20,00015历史任务图表任务管理主界面0.5人/月¥20,000¥10,00016列表任务管理主界面0.5人/月¥20,000¥10,000-48-管理模块17文件导出界面0.5人/月¥20,000¥10,00018演员库管理与审查模块敏感演员库分组创建页面0.5人/月¥20,000¥10,00019敏感演员信息上传页面0.5人/月¥20,000¥10,00020敏感演员信息检索页面0.5人/月¥20,000¥10,00021敏感演员信息删除页面0.5人/月¥20,000¥10,00022敏感演员信息编辑页面0.5人/月¥20,000¥10,00023演出人员信息库分87、组创建页面0.5人/月¥20,000¥10,00024演出人员信息上传页面0.5人/月¥20,000¥10,00025演出人员信息检索页面0.5人/月¥20,000¥10,00026演出人员信息删除页面0.5人/月¥20,000¥10,00027演出人员信息编辑页面0.5人/月¥20,000¥10,00028演出人员涉敏预警页面1人/月¥20,000¥20,00029敏感演员信息导出页面0.5人/月¥20,000¥10,00030演出人员信息导出页面0.5人/月¥20,000¥10,00031关键词库管理敏感词库管理主页面1人/月¥20,000¥20,00032敏感词上传界面0.5人/月¥2088、,000¥10,00033敏感词修订界面0.5人/月¥20,000¥10,00034敏感词分级设置界面0.5人/月¥20,000¥10,000小计小计¥420,000420,000软件合计软件合计¥9 94 40,0000,0007.37.3 硬件明细表硬件明细表产品名称参数配置数量单位备注中文/英文转写、翻译引擎1)CPU:Gold 6240 2;2)GPU 卡:NVIDIA Tesla T4 2;(T4 两块 32G 显存)3)内存:1台用于部署中英语音识别转写引擎及中英机器翻译-49-服务器256G DDR4;4)硬盘:960GB SSDx 2+6T*2 SATA;5)RAID 卡:支持89、 Raid 0、1、5、6、10;缓存 2GB;6)网卡:千兆电口;7)电源:单电源功率 1200W+,双电。引擎,为前端各类应用提供底层 AI能力支撑应用管理服务器1、CPU:Gold 5218*2;2、内存:128G=16G*8;3、硬盘:240G SSD*2+4TSATA*2;4、Raid 卡(支持 0/1/10/5/6,2G 缓存,带电池);5、网卡:4 千兆电口;1台用于部署演出市场内容监管智能系统部署存储服务器1、CPU:Gold 5218*2;2、内存:128G=16G*8;3、硬盘:240G SSD*2+6TSAS*12;4、RAID 卡:(支持 0/1/10/5/6,1台用于90、存储系统产生及摄录的数据-50-2G 缓存,带电池);5、网卡:4 千兆电口;-51-第第 8 8 章章 项目效益项目效益8.18.1 促进审核监管智能化促进审核监管智能化探索运用人工智能技术为监管提供智能化应用和服务,优化事前审核、事中监测的监管工作模式,辅助人工内容审核,缩短审校时间,提高审核效率,降低错误率,提高主动发现问题能力和监管智能化水平,促进监管模式创新。8.28.2 提升内容审核工作效率提升内容审核工作效率内容监管智能系统可实现在针对本地数据、新媒体网络音频,进行非实时的全方位监控。用户只需要明确敏感库信息,包含关键词管理,系统可以对获取到的音频数据,利用不同的 AI 技术进行不同维度的处理。系统根据用户在关键词库中注册的信息,对获取到的音视频文件、音频流进行自动分析,将识别结果同步进行比对和告警,让工作人员可以快速定位告警音频及字幕位置和告警内容,减少任务周期,提升工作效率;监控告警系统的统计分析功能,可以跟进时间日、周、月和年进行维度的统计分析,包括告警次数、告警等级、告警对象、任务类型等进行统计分析。监控大屏可以直观展现监控数据的统计分析结果,从而及时高效的为内容安全演出提供支撑。