1、大数据导论19秋期末考核0001大数据导论19秋期末考核-0001-1.以下不是数据仓库基本特征的是()A.数据仓库是面向主题的B.数据仓库是面向事务的C.数据仓库的数据是相对稳定的D.数据仓库的数据是反映历史变化的正确答案:B2.()是Microsoft Office的核心组件A.SQLB.WORDC.PPTD.EXCEL正确答案:D3.数据清洗的方法不包括A.缺失值处理B.噪声数据清除C.一致性检查D.重复数据记录处理正确答案:D4.数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段( )。A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段正确答案:B5.下列哪个R语言扩展包可
2、以制作一系列的图像并将它们串联起来做成动画()A.ggplot2B.networkC.ggmapsD.animation正确答案:D6.下列不属于Google云计算平台技术架构的是()A.并行数据处理MapReduceB.分布式锁ChubbyC.结构化数据表BigTableD.弹性云计算EC2正确答案:D7.大数据的最显著特征是() 。A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高正确答案:A8.IaaS是()的简称A.软件即服务B.平台即服务C.基础设施即服务D.硬件即服务正确答案:C9.基础设施即服务的英文简称是A.IaaSB.PaaSC.SaaS正确答案:A10.下列
3、哪个工具常用来开发移动友好地交互地图()A.LeafletB.Visual.lyC.BPizza Pie ChartsD.Gephi正确答案:A-1.数据归约(Data Reduction)主要有()A.维度规约B.样本规约C.数据聚集D.离散化概念分层正确答案:ABCD2.以下可以用于数据可视化的是()。A.R语言B.ExcelC.RapidMinerD.Weka正确答案:ABCD3.医疗大数据特点:除了包含了大数据4个“V” 的特点之外还有()A.多态性B.时效性C.不完整性D.冗余性正确答案:ABCD4.大数据存储的特点与挑战有()A.容量问题B.延迟问题C.安全问题D.成本问题正确答案
4、:ABCD5.大数据智能感知层:主要包括()及软硬件资源接入系统A.数据传感体系B.网络通信体系C.传感适配体系D.智能识别体系正确答案:ABCD6.数据预处理的过程主要是A.数据清洗B.数据集成C.数据变换D.数据规约正确答案:ABCD7.交通数据处理包括以下几个步骤()A.数据清洗B.数据映射C.数据组织D.数据聚类正确答案:ABCD8.数据工厂包括A.低能耗数据中心B.超大规模讲分布式架构C.新一代智能自动化运维D.超强云安全正确答案:ABCD9.可视化工具包括()A.ExcelB.Google ChartC.GephiD.ppt正确答案:ABC10.去除噪声使得数据光滑的技术主要有:A
5、.分箱B.回归C.离群点分析正确答案:ABC-1.在未来掘金社交数据的道路上,一方面要为用户提供更加精准便捷的良好服务,另一方面也要注重对用户隐私的保护。只有符合用户需求和用户安全的商业利益,才能成为可持续的商业利益。T.对F.错正确答案:T2.每个簇的质心(centroid)是该簇中所有数据对象的均值。T.对F.错正确答案:T3.数据存储要表现出静态数据的特征,反映的是系统中静止的数据。T.对F.错正确答案:T4.不同类型的大数据可以揭示一个区域或城市的活动以及人口分布状态( )T.对F.错正确答案:T5.Gartner研究机构给出的大数据定义是大数据一般会涉及两种或两种以上的数据形式,它需
6、要收集超过100TB的数据,并且是高速实时数据流;或者是从小数据开始,但数据每年增长速率至少为60%。T.对F.错正确答案:F6.未来考验零售企业的是如何挖掘消费者需求T.对F.错正确答案:T7.减少已分配但未使用的存储容量的浪费,在分配存储空间时,系统按需分配存储空间。T.对F.错正确答案:T8.数据存储是数据流在加工过程中产生的临时文件或加工过程中需要查找的信息。T.对F.错正确答案:T9.Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。T.对F.错正确答案:T10.FP算法比Apriori算法慢T.对F.错正确答案:F11.轨迹数据包含空间和时间属性,并且通常规
7、模巨大且维度高T.对F.错正确答案:T12.Apriori算法扫描数据库的次数等于最大频繁项集的项数。T.对F.错正确答案:T13.Facebook积累了超过12亿全球用户,其存储了大量的用户数据,这使它成为一个巨大的“数据乐园”。人们越来愈倾向于在Facebook上表达自己的情绪。T.对F.错正确答案:T14.大数据处理的关键技术主要包括:数据采集和预处理、数据存储、数据计算架构、数据分析和挖掘、数据可视化展示等。T.对F.错正确答案:T15.R是一种开源编程语言和软件环境,用于数据挖掘、数据分析和可视化。T.对F.错正确答案:T-1. 简述数据可视化的流程和步骤。正确答案:2.简述网络大数据的一般采集过程。正确答案:3.NoSQL正确答案:4.批处理正确答案:5.数据清洗正确答案:6.结构化数据正确答案: