《医学数据仓库与数据挖掘》温习期末模拟题.docx
- 文档编号:4617615
- 上传时间:2022-12-07
- 格式:DOCX
- 页数:9
- 大小:21.73KB
《医学数据仓库与数据挖掘》温习期末模拟题.docx
《《医学数据仓库与数据挖掘》温习期末模拟题.docx》由会员分享,可在线阅读,更多相关《《医学数据仓库与数据挖掘》温习期末模拟题.docx(9页珍藏版)》请在冰豆网上搜索。
《医学数据仓库与数据挖掘》温习期末模拟题
《医学数据仓库与数据挖掘》温习期末模拟题
【含答案】《医学数据仓库与数据挖掘》温习期末模拟题!
考试提纲资料2011-01-2115:
44:
03阅读0评论0字号:
大中小订阅一、选择题
1、数据仓库是随时间变化的,下面的描述不正确的是:
A、数据仓库随时间变化不断增加新的数据内容。
B、捕捉到的新数据会覆盖原来的快照。
C、数据仓库随时间变化不断删往旧的数据内容。
D、数据仓库中包含大量的综合数据,这些综taobaowang合数据会随着时间的变化不断地进行重新综合。
答案:
B2、关于基本数据的元数据是指:
A、基本元数据包括与数据源、数据仓库、数据集市和应用程序等结构相关的信息。
B、基本元数据包括与企业相关的治理方面的数据和信息。
C、基本元数据包括日志文件和建立执行处理的时序调度信息。
D、基本元数据包括关于装载和更新处理、分析处理以及治理方面的信息。
答案:
A3、下面有关数据粒度的描述不正确的是:
A、粒度是指数据仓库小数据单元的具体程度和级别。
B、数据越具体,粒度就越小,级别也就越高。
C、数据综合度越高,粒度就越大,级别也就越高。
D、粒度的具体划分将直接影响数据仓库中的数据量以及查询质量。
答案:
B4、有关数据仓库的开发特点,不正确的描述是:
A、数据仓库开发要从数据出发。
B、数据仓库使用的需求在开发出往就要明确。
C、数据仓库的开发是一个不断循环的过程,是启发式的开发。
D、在数据仓库环境中,并不存在操纵型环境中所固定的和较确切的处理流,数据仓库中数据的分析和处理更灵活,且没有固定的模式。
答案:
B5、RAID技术具有容错能力,能够满足对存储能力、性能和可靠性不断进步的要求。
实在,实现原理是将数据写进多张磁盘中,假如-张磁盘发生故障,就从其他存放冗余数据的磁盘上访问数据。
有关RAID不同级别的描述不正确的是:
A、在RAID0这一级别上,数据记录通过在多组驱动器的扇区上交错地分布着实现,没有奇偶校验,不提供任何冗余。
B、RAID1称为镜像。
在这一级别上,数据被冗余地写进成对的驱动器中,可以独立地从每个驱动器提取该数据。
这种方法没有什么缺点,是备份时候经常用到的技术。
C、RAID3数据记录在成组驱动器上,位交错,只有一个驱动器仍有奇偶校验信息。
D、RAID5假如采用这一水平的技术,则数据记录在成组的驱动器上扇区交错地存放着,所有驱动器都有奇偶校验信息。
答案:
B6、有关数据仓库测试,下列说法不正确的是:
A、在完成数据仓库的实施阶段中,需要对数据仓库进行各种测试。
测试工作中要包括单元测试和系统集成测试。
B、当数据仓库的每个单独组件完成后,就需要对它们进行单元测试。
C、系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回回测试。
D、在测试之前没必要制定具体的测试计划。
答案:
D7、OLAP技术的核心是:
A、在线性
B、对用户的快速响应
C、互操纵性
D、*分析平价美白产品
答案:
D8、关于OLAP的特性,下面正确的是:
①快速性②可分析性③*性④信息性⑤共享性
A、①、②、③
B、②、③、④
C、①、②、③、④
D、①、②、③、④、⑤
答案:
D9、关于OLAP和OLTP的区别的描述,不正确的是:
A、OLAP主要是关于如何理解聚集的大量不同的数据。
它与OLAP应用程序不同。
B、与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务。
C、OLAP的特点在于事务量大,但事务内容比较简单且重复率高。
D、OLAP是以数据仓库为基础的,其终极数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的。
答案:
D10、OLAM技术一般简称为"数据联机分析挖掘",下面说法正确的是:
A、OLAP和OLAM都基于客户机/服务器模式,只有后者有与用户的交互性。
B、由于OLAM的立方体和用于OLAP的立方体有本质的区别。
C、基于Web的OLAM是Web技术与OLAM技术的结合。
D、OLAM服务器通过用户图形接口接收用户的分析指令,在元数据的指导下,对超级立方体作一定的操纵。
答案:
D11、数据仓库的数据具有四个基本特征,下列不正确的是:
A、面向主题的。
B、集成的。
C、不可更新的。
D、不随时间变化的。
答案:
D12、下列是关于OLAP的描述,不正确的是:
A、一个*数组可以表示为:
(维1,维2,…,维n)
B、维的一个取值称为该维的一个维成员
C、OLAP是联机分析处理
D、OLAP是以数据仓库进行分析决策的基础
答案:
A13、关于OLAP和OLTP的说法,下列不正确的是:
A、OLTP事务量大,但事务内容比较简单且重复率高
B、OLAP的终极数据来源与OLTP不一样
C、OLTP面对的是决策职员和高层治理职员
D、OLTP以应用为核心,是应用驱动的
答案:
B14、关于数据仓库元数据的描述,下列不正确的是:
A、元数据描述了数据的结构、内容、码、索引等项内容。
B、元数据内容在设计数据仓库时确定后,就不应该再改变。
C、元数据包含对数据转换的描述。
D、元数据是有效治理数据仓库的重要条件。
答案:
B15、下列描述不正确的是:
A、模型辅助决策系同一般可以使用若干个模型来解决同一题目。
B、人机交互系统是决策支持系统的一个组成部分。
C、决策支持系统包含模型库和模型库治理系统。
D、智能决策支持系统包含知识库系统。
答案:
A16、决策支持系统可以用不同的方法进行构造,下列的说法不正确的是
A、可以用生命周期法和原型法构造决策支持系统。
B、原型法是一个迭代过程。
C、原型法中不存在对用户的反馈。
D、SDLC即是系统开发的生命周期法
答案:
C17、数据清洗是数据转移的一种基本类型,它不能通过下列的那种方法来完成:
A、范围检验
B、枚举清单
C、相关检验
D、删除分歧格的数据
答案:
D18、下列不是数据转移的基本类型的是:
A、简单转移
B、清洗
C、集成
D、继续
答案:
D19、开展数据挖掘的基本目的是:
A、建立数据仓库。
B、帮助用户作决策。
C、从大量数据中提取有用信息。
D、对数据进行统计和分析。
答案:
C20、产生数据挖掘的根本原因是:
A、数据统计分析。
B、技术的发展。
C、贸易推动。
D、数据仓库的产生。
答案:
A21、()是通过数据库中的一些属性来猜测另一个属性,它在验证用户提出的假设的过程中提取信息。
A、文本数据挖掘
B、发现驱动的数据挖掘
C、验证驱动的数据挖掘
D、Web数据挖掘
答案:
C22、对于在数据仓库中设计、使用OLAP的用户来说,下面不属于OLAP的衡量标准的是:
A、解释性批处理提取。
B、弹性报告和一致性能报告。
C、对物理层的自动调整。
D、体系结构。
答案:
D23、对MOLAP和ROLAP的比较,不正确的说法是:
A、MOLAP的查询能力一般较好,而在ROLAP中进行查询,往往很难预料查询结果。
B、MOLAP所需要的数据加载时间比较长,而ROLAP的加载时间要比MOLAP短。
C、ROLAP比MOLAP的查询速度都要快很多。
D、MOLAP在分析过程中的精度较高,具有分析的上风。
答案:
C24、关于OLAP服务器及其工具,说法正确的是:
A、只有Oracle提供了OLAP功能。
B、评价OLAP服务器的标准不包括全局结构视图。
C、OLAP的服务引擎都应满足分析模型及应用在功能、规模和技术特征上的要求。
D、对OLAP服务器的治理能力没有特别的要求。
答案:
C25、数据挖掘工具按照使用方式分类,可以分为:
A、分为基于神经网络的工具,基于规则和决策树的工具,基于模糊逻辑的工具和综合性数据挖掘工具等。
B、分成决策方案天生工具,贸易分析工具和研究分析工具三类。
C、分成专用型数据挖掘工具和通用型数据挖掘工具两大。
D、分成基于神经网络的工具和研究分析工具。
答案:
B
二、填空题
1、数据仓库(简答题必考)是_、_、_、_有组织的数据集合,支持治理的决策过程。
答案:
面向主题、集成的、时变的、非易失的
2、一般来说,可将数据仓库的开发和应用过程细分为_、_、_、_。
答案:
设想阶段、规划和长大阶段、控制阶段和稳定阶段
3、_是对现实世界进行抽象的工具,需要将现实世界的事物及其有关特征转换为信息世界的数据,才能对信息进行处理与治理,这就需要依靠_作为这种转换的桥梁。
这种转换经历了从现实到_,从_到_,最后从_到物理模型的转换。
答案:
数据模型、数据模型、概念模型、概念模型、逻辑模型、逻辑模型
4、元数据(简答题必考)是关于数据、_和应用程序的结构和意义的描述信息,其主要目标是_。
其范围可以是某个特别的数据库治理系统中从现实世界的概念上的一般概括,到_。
答案:
操纵数据的进程、提供数据资源的全面指南、具体的物理说明
5、按对象级别对元数据进行分类,可以从三个抽象级别上来熟悉:
_、逻辑级和_。
答案:
概念级、物理级
6、数据库系统的特点主要体现在下面几个方面:
_、数据的共享性、_和_。
答案:
数据的结构化、数据的独立性、数据同一由DBMS治理和控制。
7、依据数据仓库数据量大但是操纵单一的特点,可以采取一些技术来进行数据仓库的物理数据模型设计,如:
合并表、_、引进冗余、_、建立广义索引等等。
答案:
建立数据序列、表的物理分割、天生导出数据
8、数据仓库的接*术包含多技术接*术、_和数据的高效率加载技术。
答案:
语言接*术
9、数据仓库中数据的组织方式与数据库不同,通常采用_分级的方式进行组织。
-般包括早期细节数据、_、轻度综合数据、_以及_五部分。
答案:
当前细节数据、高度综合数据、元数据
10、数据仓库的需求分析根据不同领域可以划分为_、设计的需求、_和终极用户的需求等方面。
答案:
业主(投资者)的需求、开发者的需求
11、数据仓库固然是从数据库发展而来的,但两者存在大的差异,从数据存储内容看,数据库只存放_,而数据仓库则存放_,数据库中的数据的目标是面向_,而数据仓库则面向_。
答案:
当前值、历史值、业务操纵职员、高层治理职员
12、数据库内的数据是_的,只要有业务发生,数据就会更新,而数据仓库则是_的历史数据,只能定期添加、刷新。
答案:
动态变化、静态
13、数据仓库主要是供决策分析用的,所涉及的数据操纵主要是_,一般情况并不进行_
答案:
数据查询、修改操纵
14、数据仓库创建后,首先从_中抽取所需要的数据到数据预备区,在数据预备区中经过_的净化处理,再加载到数据仓库数据库中,最后根据用户的需求将数据发布到_。
答案:
数据源、数据、数据集市/知识挖掘库中
15、"主题"在数据仓库中由一系列_实现的。
一个主题之下表的划分可按_、数据所属时间段进行划分。
主题在数据仓库中可用_方式进行存储,假如主题存量大为进步处理效率可采用_方式进行存储。
答案:
列表、数据的综合、*数据库、关系数据库
三、简答题
1、什么是数据挖掘(DataMining)?
(简答题必考)
答案:
数据挖掘(DataMining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜伏有用的信息和知识的过程。
挖掘的数据源必须是真实的、大量的、含噪声的;发现的是用户感爱好的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现题目。
2、数据挖掘研究内容是什么?
答案:
主要研究内容包括基础理论、发现算法、数据仓库、可视化技术、定性定量互换模型、知识表示方法、发现知识的维护和再利用、半结构化和非结构化数据中的知识发现以及网上数据挖掘等。
3、数据挖掘提取出的知识主要由哪些类型?
答案:
数据挖掘所发现的知识最常见的有以下四类:
广义知识(Generalization),关联知识(As淡斑精华sociation),分类知识(Classification&Clustering),猜测型知识(Prediction),偏差型知识(Deviation)。
4、什么是专家系统?
答案:
专家系统是一个智能计算机程序系统,其内部含有大量的某一个领域专家水平的知识与以验,能够利用人类专家的知识和解决题目的方法来处理领域题目,专家系统是一种模拟人类专家解决领域题目的计算机程序系统。
5、简述数据仓库的组成。
答案:
数据仓库治理部分的组成包括:
①定义部件。
这一部件用于定义和建立数据仓库系统,
●设计和定义数据仓库的数据库。
●定义数据来源。
●确定数据源向数据仓库复制销售最好的美白产品数据的转换、清理规则。
②数据获取部件。
依据数据定义部件定义的规则从数据源中指数据抽取到数据仓库中,完成清洗、变换和集成工作,将数据装载到数据仓库中,定期清理数据仓库,消除数据仓库与源数据库的不一致,清除失效数据等。
一般情况下可以通过一些通用工具完成,但是由于数据源中的数据类型、格式非常复杂,因此有些情况下需要编终关定的工具完成数据获取工作。
③治理部件。
主要包括对数据仓库中数据的维护、安全、备份、恢复、日志等工作。
这些工作需要借助数据库治理系统的功能实现。
④元数据治理,也可称为信息目录治理。
它主要完成元数据的治理、存储以及对整个数据仓库数据的检测和治理,由以下部分组成:
●技术元数据。
技术元数据由关于数据源、目标、转换规则、清理规则以及数据源与数据仓库之间的映射组成。
●业务目录。
业务目录由数据仓库治理员天生,由数据来源、当前值、预定义的查询等方面组成,是针对具体应用数据的元数据治理。
(2)数据仓库工具集
数据仓库工具集主要由一些分析工具组成,主要包括检索查询工具、*数据的OLAP分析工具、统计分析以及数据挖掘工具等(严格地说,数据挖掘工具只是数据仓库支持辅助决策的一种方法,数据挖掘列以从数据仓库中挖掘知识、规律,也可以从数据库或者一些平*募?
型诰颍?
谴又С指ㄖ?
霾叩慕嵌壤纯矗?
匚?
莶挚庀低车囊徊糠))
OLTPPOLAP的主要区别有以下几点:
(简答题必考?
(1)))、所面向的用户和系统OLTPPP是面向客户的,由职员或客户进行事务处理或者查询处茧LApppp是向向市场的,由经理、主管和分析职员进行数据分析和决策的?
222)、数据内容OLTPPP系统治理当前数据,这些数据通常很琐碎,难以用于决睴LAPPPP系统治理大量历史数据,提供汇总和聚集机制,并在不同的粒度级别上存储和治理信息,这些特点使得数据适合于决策分析?
333)、数据库设计:
通常OLTPPP睧RRRR模型和面向应用的数据库设计,禣LAPP系统通常采用星型模式或雪花模式和面向主题的数据库设计
444)、视蚈LTPPPP系统主要关注一个企业或部分确当前数据,而不涉及历史数据或不同组织的数据。
与之相反?
LAPP系统经常跨越一个企业的数据库模式的多个版本OLAPPP系统也处理来自不同组织的信息,由多个数据源集成的信息
?
555)、访问模式?
LTPP系统的访问主要由短的原子事务组成,这种系统需要并发控制和恢复机制。
OLAPPP系统的访问大部份是只读操纵,其中大部份是复杂查询
?
666)、度量?
LTPP专注于日常时实操纵,所以以事务吞吐量为度量OLAPPP以查询吞吐量和响应时间来度量
?
imgsrc="onClick="window.open('onerror="this.src='onload="addjustimg(this)"TYPE="audio/mpeg"
[热门]银杏果含无多类养分元素气管炎哮喘食疗
特别声明:
1:
资料来源于互联网,版权归属原作者
2:
资料内容属于网络意见,与本账号立场无关
3:
如有侵权,请告知,立即删除。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学数据仓库与数据挖掘 医学 数据仓库 数据 挖掘 温习 期末 模拟