智慧检务业务系统建设方案文档格式.docx
- 文档编号:15235730
- 上传时间:2022-10-28
- 格式:DOCX
- 页数:21
- 大小:41.81KB
智慧检务业务系统建设方案文档格式.docx
《智慧检务业务系统建设方案文档格式.docx》由会员分享,可在线阅读,更多相关《智慧检务业务系统建设方案文档格式.docx(21页珍藏版)》请在冰豆网上搜索。
第二章总体设计2.1建设原则系统建设遵循如下基本原则:
Ø
全面性系统总体设计应遵循科学的设计理念,各个组成部分均符合当代信息技术发展形势,满足未来对信息化发展的要求,提供针对各种数据源的接口支持。
开放性在现有应用系统和手段建设中有大量资源,包括软硬件环境资源和大量信息资源,在实现资源共享时要统一规划,最大限度实现各类资源共享,支持各地业务工作的开展。
系统需提供多种数据访问、服务调用和资源管理接口,实现资源和服务对其他业务手段和使用人员的共享。
灵活性平台设计需采用灵活架构实现可配置,动态可扩展和自定义,有较强的可扩展性。
安全性系统必须有高可靠性,能够长时间运行而不宕机,要保证系统使用的连续性。
建立全局的数据安全机制,建立统一的访问控制机制,实现统一的身份认证、访问控制、审计等安全机制。
易维护性系统需要具备可解决问题并易于管理的系统。
贯彻面向最终用户的原则,部署快捷,具有了友好的用户界面,操作简单、直观、灵活,易于学习和掌握。
2.2设计依据本项目实施工作方案严格依据国家相关法律、法规、政策和技术标准,涉及到的主要技术标准和规范性文件有:
l《涉及国家秘密的计算机信息系统保密技术要求》(BMZ1-2000)l《信息安全技术信息系统安全等级保护基本要求》(GB/T*****2008)l《信息安全等级保护管理办法》公通字43号l《信息系统安全等级保护定级指南》GBT*****-2008l《计算机信息系统安全保护等级划分标准》(GB*****-1999)l《计算机软件质量保证计划规范》(GB/T*****-1990)l《计算机软件配置管理计划规范》(GB/T*****-1990)l……第三章检察大数据平台建设方案3.1系统目标大数据基础平台以“整合资源、共享数据、提供服务”为指导思想,构建满足检察行业的信息化建设需求。
检务大数据库基础平台主要实现以下几个功能:
建设检务大数据库中心、打造检务大数据标准体系、创新检务大数据应用、构建检察大数据管理体系。
l建设检务大数据中心检务大数据中心数据来源主要来源于一下几个方面:
基于统一业务应用系统等案件管理软件产生的结构化、非结构化数据。
基于检察机关和政法机关的共享数据。
基于互联网的公开数据。
通过对以上数据的采集、整理、清洗、转换等相关操作,把结构化和非结构化数据进行分别入库,完成检务大数据的数据中心搭建。
l打造检务大数据标准体系依托电子检务工程的标准体系,建立健全内容完整、项目科学、协调统一的检务大数据标准体系,建立检务大数据基础数据采集、应用、安全等技术标准体系,推进物理环境、网络基础设施、数据采集、数据质量、分类目录等关键共性标准的制定和实施,推进大数据业务系统操作规范等流程标准制定,制定检务大数据管理规范。
l创新检务大数据应用体系积极推进智慧检务基础类应用建设,依托大数据为深化司法体制改革和检察改革提供全面的数据服务。
积极推进大数据在司法办案、检察办公、队伍管理、检务保障、检察决策支持、检务公开和服务等领域的深层次应用,推进大数据在政法业务协同中的应用,充分利用大数据为检察院与公安、法院等政法机关之间的业务协同提供服务,探索构建政法机关之间的大数据业务协同创新体系,提供基于大数据的多样化智能辅助检察应用。
l构建检务大数据运维体系建立健全检务大数据管理机制,充分发挥业务部门的主导作用和技术部门的统筹作用,搭建检察大数据运维管理模式。
目前,我们已经探索出一套适合检察业务的大数据运维保障体系。
3.2系统架构系统总体架构数据采集组件基于Flume的开发海量检察业务的数据采集、聚合和传输采用Cloudera的Flume并进行自主开发,支持在日志系统中定制各类数据发送方,用于收集数据;
同事提供对数据进行初步处理并写到各种数据接受方的能力。
基于Flume的开发为大数据辅助决策平台提供高性能、分布式文本数据流采集能力。
基于Storm的开发基于Storm进行组织开发,为分布式实时计算提供一组通用原语,用于流处理之中,实时处理消息并更新数据库;
用户连续计算,对数据流连续查询,在计算时将结果以流的形式输出;
用于分布式RPC,以并行的方式运行计算机远程运算。
基于Storm开发为大数据辅助决策平台提供流式计算能力,能大大提高系统的实时性,检务大数据应用平台支持复杂运算如语义抽取、语义分析,指标计算等,如从法律文书中实时抽取相关业务数据,并进行相关统计指标计算。
消息组件基于kafaka开发基于kafka进行自主开发处理高吞吐量的分布式订阅,处理大数据平台中的所有动作流数据。
这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。
局域kafka开发的目的是通过Hadoop的并行加载机制来统一线上和离线的消息处理,通过集群机制来提供实时的信息处理。
基于kafka的开发为大数据平台提供高性能、高稳定、高并发的消息队列,用于提升大数据应用平台消息通讯,处理消息堆积等。
数据存储组件基于HBASE的开发基于HBASE开发分布式的、面向列的数据库,主要是用于结构化数据的分布式存储,支持在分布式文件系统上提供大吞吐量、大数据量数据应用能力;
同时也适合非结构化数据列存储、适用于数据分析。
将HBASE结合Hive、Kylin进行开发,为检务大数据平台提供结构化数据的分布式存储和分布式高性能数据分析,支持电子检务核心统计分析的数据实现秒级更新和多维OLAP分析。
基于ELK的开发基于Lucene的开发,提供分布式多用户能力的全文检索引擎,基于RESTFulweb接口,用于云计算中,达到实时、稳定、可靠、快速搜索。
将ELS与语义分析引擎结合开发,为大数据平台提供半结构化、非结构化数据处理能力,增强统一检索服务能力。
基于Spark的开发Spark是HadoopMapReduce的通用并行框架,其Job中间输出结果可以保存在内存中,启用了内存分布数据集,不需要读写HDFS,因此Spark能够提供交互式查询外,能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法,它还可以优化迭代工作负载。
基于NEO4J基于Neo4J开发java持久化、嵌入式、高性能、轻量级的图形引擎,具有成熟数据库的所有特性,将数据存放于图上而非二维表中。
基于Neo4J的开发组件,支持检务大数据应用平台中的案件画像、当事人画像、企事业单位画像的关系描述。
通过BI实现海量数据实时在线分析服务,支持拖拽式操作、提供丰富的可视化效果,可以帮助轻松自如地完成数据分析、业务数据探查、报表制作等工作。
架构主要由数据建模层、数据分析层和数据展示层组成,分别描述如下:
1、数据建模层数据建模层包括数据源、SQL查询、Excel及CSV文件查询、脚本查询、定制查询、数据集市查询、内嵌查询、组合查询、Mongo查询、ETL建模工具。
基于MPP数据集市,无需CUBE、二次表以及各种复杂的计算模型,系统即可基于细节数据,在前端完成各种维度可视化组合计算,无论数据大小,所有的计算都在眨眼间完成。
数据建模层提供简单易用的建模界面,经过简单的鼠标点击与设置即可生成自己想要的数据模型,整个建模过程直观明了。
2、数据分析层无论是终端用户还是IT开发人员都可以通过intranet/internet用主流浏览器来访问数据分析层,用户还可通过移动终端来访问系统。
数据分析层提供系统监控,权限多级管理,多维数据分析,等等功能,还支持自服务式报表设计和数据分析。
提供简单方便的数据可视化操作界面,用户能够以简单的拖拉拽操作即可实现自助数据分析。
3、数据展示层作为整个大数据管理应用平台的用户接口,为使用者提供统一的作业调度工具,提供可视化ETL作业、报表作业、分布式计算作业的自动调度平台。
提供作业之间的依赖管理和作业的监控管理。
主要功能包括但不限于:
(1)数据源:
支持Oracle、MySQL、SQLSever等数据源的连接。
(2)数据集:
支持基于SQL、数据表的创建数据集两种方式,并提供数据集表结构预览功能;
支持字段名称重定义、层次扩展、字段类型格式化、日期数据格式化、字段扩展等功能;
支持在线配置数据集关联,包括左关联、右关联、全关联等操作;
支持表结构同步刷新和刷新预览数据等功能。
(3)仪表盘:
支持拖拽式进行组件选择和布局,自动调整和适配各种屏幕大小;
支持PC、移动、大屏等多终端的配置,并且能做到一次配置自动适配多终端;
支持主流的图表组件,例如柱状图、折线图、条形图、面积图、饼图等;
支持图表组件的样式控制,支持标题重定义及显示控制、颜色自定义、XY轴切换、图例显示控制等操作;
多组件关联查询,支持跨库、跨数据集的关联查询控制;
支持多个组件的联动分析与查询,实现在线数据分析;
组件下钻分析,通过设置字段之间的层次关系,可以自动化实现数据钻取的功能;
支持筛选器、文本、iframe、TAB、图片等多种控件。
(4)电子表格:
支持二维表格的Excel的界面风格;
支持类Excel的冻结窗口、筛选、过滤等基本操作;
支持样式控制,可以进行边框、字体、背景等各种样式控制,并支持类Excel的拖拉拽式填充。
支持文本函数、数字函数、汇总函数、查找和引用函数等300种函数,支持跨Sheet引用,并支持类Excel的拖拉拽式填充,支持类Excel风格的图表配置组件。
(5)数据门户:
支持门户信息自定义配置。
(6)安全管控:
支持用户组织、角色管理,支持访问授权控制,支持批量导入用户数据;
支持行级数据访问权限控制;
(7)在线协同机制:
支持公开、分享、协同编制等多种在线分享机制;
支持电子表格或仪表盘移动端查看、邮件发送以及导出。
3.3关键技术3.3.1实时数据采集平台3.3.1.1平台架构3.3.1.2平台介绍实时数据采集是高实时、高吞吐的的基础数据服务,实现动态数据的实时收集,实时处理。
支持多种数据传输协议和消息队列,Flume、TPC、Kafka、Logstash;
以及多种数据存储方式,如HBase、ELastiSearch、MySql、HDFS,利用javaAPI进行二次开发,可以灵活的组合数据的生产、消费和存储,为业务数据的实时消费、实时统计提供技术支持。
3.3.1.3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 智慧 业务 系统 建设 方案