文档库 最新最全的文档下载
当前位置:文档库 › 我们的大数据时代题目及答案电子版(16年7月)

我们的大数据时代题目及答案电子版(16年7月)

我们的大数据时代题目及答案电子版(16年7月)
我们的大数据时代题目及答案电子版(16年7月)

我们的大数据时代(83分)

红色都是本人自己对照书找过了的。

(一)

单选题(每题2分)

1. 下列关于舍恩伯格对大数据特点的说法中,错误的是(D)5

A. 数据规模大

B. 数据类型多样

C. 数据处理速度快

D. 数据价值密度高

2. 下列关于大数据的分析理念的说法中,错误的是(D)8

A. 在数据基础上倾向于全体数据而不是抽样数据

B. 在分析方法上更注重相关分析我不是因果分析

C. 在分析效果上更追究效率而不是绝对精确

D. 在数据规模上强调相对数据而不是绝对数据

3. 万维网之父是(C)2

A. 彼得·德鲁克

B. 舍恩伯格

C. 蒂姆·伯纳斯—李

D. 斯科特·布朗

4. 下列关于普查的缺点的说法中,正确的是(A)。52

A. 工作量较大,容易导致调查内容有限、产生重复和遗漏现象

B. 误差不易被控制

C. 对样本的依赖性比较强

D. 评测结果不够稳定

5.下列关于聚类挖掘技术的说法中,错误的是(B)。78

A. 不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别

B. 要求同类数据的内容相似度尽可能小

C. 要求不同类数据的内容相似度尽可能小

D. 与分类挖掘技术相似的是,都是要对数据进行分类处理

6. 智慧城市的构建,不包含(C)。13

A. 数字城市

B. 物联网

C. 联网监控

D. 云计算

7.大数据的起源是(C)。3

A. 金融

B. 电信

C. 互联网

D. 公共管理

8. 智慧城市的智慧之源是(C)。13

A. 数字城市

B. 物联网

C. 大数据

D. 云计算

9. 假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人更容易得肺癌。基因和肺癌就是(A因果)关系,而吸烟和肺癌则是(A相关)关系。8

A.因果;相关

B. 相关;因果

C. 并列;相关

D. 因果;并列

10. 下列关于数据交易市场的说法中,错误的是(C)。35

A. 数据交易市场是大数据产业发展到一定程度的产物

B. 商业化的数据交易活动催生了多方参与的第三方数据交易市场

C. 数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助

D. 数据交易市场是大数据资源化的必然产物

11. 下列关于计算机存储容量单位的说法中,错误的是(C)。2

A. 1KB<1MB<1GB

B. 基本单位是字节(Byte)

C. 一个汉字需要一(2)个字节的存储空间

D. 一个字节能够容纳一个英文字符

12. 当前大数据技术的基础是由(C)首先提出的。2

A. 微软

B. 百度

C. 谷歌

D. 阿里巴巴

13. 下列国家的大数据发展行动中,集中体现“重视基础、首都先行”的国家是(D)。23

A. 美国

B. 日本

C. 中国

D. 韩国

14. 下列演示方式中,不属于传统统计图方式的是(D)。7

A. 柱状图

B. 饼状图

C. 曲线图

D. 网络图

15. 当前社会中,最为突出的大数据环境是(A)。36

A. 互联网

B. 物联网

C. 综合国力

D. 自然资源

16. 可以对大数据进行深度分析的平台工具是(C)。42

A. 传统的机器学习和数据分析工具

B. 第二代机器学习工具

C. 第三代机器学习工具

D. 未来机器学习工具

17. 智能健康手环的应用开发,体现了(D)的数据采集技术的应用。59

A. 统计报表

B. 网络爬虫

C. API接口

D. 传感器

18. 过一系列处理,在基本保持原始数据完整性的基础上,减小数据规模的是(C)。69

A. 数据清洗

B. 数据融合

C. 数据规约

D. 数据挖掘

19. 制成大数据业务的基础是(A)。

A. 数据科学

B. 数据应用

C. 数据硬件

D. 数据人才

20. 面向用户提供大数据一站式部署方案,包括数据中心和服务器等硬件、数据分析应用软件及技术运维支持等多方面内容的大数据商业模式是(A)。33

A. 大数据解决方案模式

B. 大数据信息分类模式

C. 大数据处理服务模式

D. 大数据资源提供模式

21. 美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的(B)。8-9

A. 在数据基础上倾向于全体数据而不是抽样数据

B. 在分析方法上更注重相关分析而不是因果分析

C. 在分析效果上更追究效率而不是绝对精确

D. 在数据规模上强调相对数据而不是绝对数据

22. 数据仓库的最终目的是(D)。61-62

A. 收集业务需求

B. 建立数据仓库逻辑模型

C. 开发数据仓库的应用分析

D. 为用户和业务部门提供决策支持

23. 大数据的最显著特征是(A)。5

A. 数据规模大

B. 数据类型多样

C. 数据处理速度快

D. 数据价值密度高

24. 根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。40

A. 数据管理人员

B. 数据分析员

C. 研究科学家

D. 软件开发工程师

25. 下列论据中,能够支撑“大数据无所不能”的观点的是(A)。27

A. 互联网金融打破了传统的观念和行为

B. 大数据存在泡沫

C. 大数据具有非常高的成本

D. 个人隐私泄露与信息安全担忧

多选题(每题3分)

26. 下列各国大数据发展路径的描述中,对应关系正确的是(ACDE)。23

A. 日本:走尖端IT路线

B. 英国(新加坡):视大数据为新的自然资源

C. 韩国:重视基础、首都先行

D. 印度:以IT外包转型为突破口

E. 澳大利亚: 原则先行、谨慎发展

27. 当前,大数据产业发展的特点是(BCE)。

A. 规模较大

B. 规模较小

C. 增速很快

D. 增速缓慢

E. 多产业交叉融合

28. 下列关于大数据的说法中,错误的是(AD)。5

A. 大数据具有体量大、结构单一、时效性强的特征

B. 处理大数据需采用新型计算机架构和智能算法等新技术

C. 大数据的应用注重相关分析而不是因果分析

D. 大数据的应用注重因果分析而不是相关分析

E. 大数据的目的在于发现新的知识与洞察并进行科学决策

29. 下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是(ABC)。

A. 传统营销模式比基于大数据的营销模式投入更小

B. 传统营销模式比基于大数据的营销模式针对性更强

C. 传统营销模式比基于大数据的营销模式转化率低

D. 基于大数据的营销模式比传统营销模式实时性更强

E. 基于大数据的营销模式比传统营销模式标准性更强

30. 按照服务目的不同,数据流通平台可分为(CDE)。35

A. 政府数据开放平台

B. 企业数据开放平台

C. 数据交易市场

D. 数据研发市场

E. 数据废弃交易市场

31. 下列论据中,能够支撑“大数据无所不能”的观点的是(ADE)。26-28

A. 互联网金融打破了传统的观念和行为

B. 大数据存在泡沫

C. 大数据具有非常高的成本

D. 大数据医疗正在走进平民百姓

E. 数据资产型企业前景光明

32. 大数据的价值体现在(ABCDE)。10-17

A. 大数据给思维方式带来了冲击

B. 大数据为政策制定提供科学依据

C. 大数据助力智慧城市提升公共服务水平

D. 大数据实现了精准营销

E. 大数据的发力点在于预测(

F.大数据为社会发展带来新动力。)

33. 当前大数据技术的基础包括(ABD)。6

A. 分布式文件系统

B. 分布式并行计算

C. 关系型数据库

D. 分布式数据库

E. 非关系型数据库

34. 可视化高维展示技术在展示数据之间的关系以及数据分析结果方面的作用是(BD)。7

A. 能够直观反映成对数据之间的空间关系

B. 能够直观反映多维数据之间的空间关系

C. 能够静态演化事物的变化及变化的规律

D. 能够动态演化事物的变化及变化的规律

E. 提供高性能并行计算技术的强力支撑

35.下列关于计算机存贮容量单位换算关系的公式中,正确的是(BE)。2

A. 1KB=1012Byte

B. 1KB=1024Byte

C. 1GB=1024KB

D. 1GB=1012MB

E. 1GB=1024MB

判断题(每题2分)

36. 第三方数据处理模式表现为:服务商通过软件即服务或平台即服务云服务形式为用户提供自己的数据上传到服务商的平台上,由平台进行分析处理,用户可以在线查看相应的结果。(√)34

37. 对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息精确。(×)9

38. 对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同最好集中处理。(×)

39.在美国的大数据大棋中,“五眼”是指配合美国进行全球监控的包含美国、英国、加拿大、荷兰在内的五个国家。(错)(澳大利亚)22

40. 啤酒与尿布的经典案例,充分体现了实验(相关)思维在大数据分析理念中的重要性。(×)

41.当前,企业提供的大数据解决方案大多基于Ha doop开源项目。(√)33

42. 澳大利亚政府视大数据为新的自然资源,积极承担数据提供者的角色,主动披露政府。(×)24

43. 大数据可以分析与挖掘出之前人们不知道或者没有注意到的模式,可以从海量数据中发展趋势,虽然也有不精准的时候,但并不能因此而否定大数据挖掘的价值。(√)32

44.数据资产型企业产品线的盈利,主要通过提供收费服务来获取。(√)28-29

45.在大数据的范畴内,应该把用户视为互联网中的数据分子,独立、细致地对其行为进行为特征,充分挖掘大数据的价值,变数据为资产。(×)

(二)

单选题(每题2分)

1、当前大数据技术的基础是由( C)首先提出的。

A:微软

B:百度

C:谷歌

D:阿里巴巴

2、大数据的起源是(C )。 1

A:金融

B:电信

C:互联网

D:公共管理

3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( C)。

A:数据管理人员

B:数据分析员

C:研究科学家

D:软件开发工程师

4、(D )反映数据的精细化程度,越细化的数据,价值越高。105

A:规模

B:活性

C:关联度

D:颗粒度

5、数据清洗的方法不包括(D)。66

A:缺失值处理

B:噪声数据清除

C:一致性检查

D:重复数据记录处理

6、智能健康手环的应用开发,体现了( D)的数据采集技术的应用。59

A:统计报表

B:网络爬虫

C:API接口

D:传感器

7、下列关于数据重组的说法中,错误的是( A)。93

A:数据重组是数据的重新生产和重新采集

B:数据重组能够使数据焕发新的光芒

C:数据重组实现的关键在于多源数据融合和数据集成

D:数据重组有利于实现新颖的数据模式创新

8、智慧城市的构建,不包含( C)。

A:数字城市

B:物联网

C:联网监控

D:云计算

9、大数据的最显著特征是( A)。

A:数据规模大

B:数据类型多样

C:数据处理速度快

D:数据价值密度高

10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的(B)。8-9

A:在数据基础上倾向于全体数据而不是抽样数据

B:在分析方法上更注重相关分析而不是因果分析

C:在分析效果上更追究效率而不是绝对精确

D:在数据规模上强调相对数据而不是绝对数据

11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D )。5

A:数据规模大

B:数据类型多样

C:数据处理速度快

D:数据价值密度高

12、当前社会中,最为突出的大数据环境是(A )。2

A:互联网

B:物联网

C:综合国力

D:自然资源

13、在数据生命周期管理实践中,( B)是执行方法。87

A:数据存储和备份规范(是保障和基础)

B:数据管理和维护

C:数据价值发觉和利用

D:数据应用开发和管理

14、下列关于网络用户行为的说法中,错误的是( C)。

A:网络公司能够捕捉到用户在其网站上的所有行为

B:用户离散的交互痕迹能够为企业提升服务质量提供参考

C:数字轨迹用完即自动删除

D:用户的隐私安全很难得以规范保护

15、下列关于计算机存储容量单位的说法中,错误的是( C)。

A:1KB<1MB<1GB

B:基本单位是字节(Byte)

C:一个汉字需要一(两)个字节的存储空间

D:一个字节能够容纳一个英文字符,

16、下列关于聚类挖掘技术的说法中,错误的是(B )。

A:不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别

B:要求同类数据的内容相似度尽可能小

C:要求不同类数据的内容相似度尽可能小

D:与分类挖掘技术相似的是,都是要对数据进行分类处理

17、下列国家的大数据发展行动中,集中体现“重视基础、首都先行”的国家是( D)。23 A:美国

B:日本

C:中国

D:韩国

18、下列关于大数据的分析理念的说法中,错误的是(D )。 8.9

A:在数据基础上倾向于全体数据而不是抽样数据

B:在分析方法上更注重相关分析而不是因果分析

C:在分析效果上更追究效率而不是绝对精确

D:在数据规模上强调相对数据而不是绝对数据

19、万维网之父是( C)。

A:彼得·德鲁克

B:舍恩伯格

C:蒂姆·伯纳斯-李

D:斯科特·布朗

20、Mac OS系统的开发者是(C )。

A:微软公司

B:惠普公司

C:苹果公司

D:IBM公司

21、大数据时代,数据使用的关键是( D)。90

A:数据收集

B:数据存储

C:数据分析

D:数据再利用

22、下列关于数据交易市场的说法中,错误的是( C)。35

A:数据交易市场是大数据产业发展到一定程度的产物

B:商业化的数据交易活动催生了多方参与的第三方数据交易市场

C:数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助 D:数据交易市场是大数据资源化的必然产物

23、下列论据中,能够支撑“大数据无所不能”的观点的是( A)。

A:互联网金融打破了传统的观念和行为

B:大数据存在泡沫

C:大数据具有非常高的成本

D:个人隐私泄露与信息安全担忧

24、数据仓库的最终目的是(D )。

A:收集业务需求

B:建立数据仓库逻辑模型

C:开发数据仓库的应用分析

D:为用户和业务部门提供决策支持

25、支撑大数据业务的基础是( B)。

A:数据科学

B:数据应用

C:数据硬件

D:数据人才

多选题(每题3分)

26、在网络爬虫的爬行策略中,应用最为基础的是(AB )。 55

A:深度优先遍历策略

B:广度优先遍历策略

C:高度优先遍历策略(错)

D:反向链接策略

E:大站优先策略

27、当前,大数据产业发展的特点是(ACE )。 5.6

A:规模较大

B:规模较小

C:增速很快

D:增速缓慢

E:多产业交叉融合

28、下列关于数据生命周期管理的核心认识中,正确的是(ABC )。87

A:数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段

B:在不同的数据存在阶段,数据的价值是不同的

C:根据数据价值的不同应该对数据采取不同的管理策略

D:数据生命周期管理旨在产生效益的同时,降低生产成本

E:数据生命周期管理最终关注的是社会效益(错)

29、下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是( AB)。15 A:传统营销模式比基于大数据的营销模式投入更小(大)

B:传统营销模式比基于大数据的营销模式针对性更强(不强)

C:传统营销模式比基于大数据的营销模式转化率低

D:基于大数据的营销模式比传统营销模式实时性更强

E:基于大数据的营销模式比传统营销模式精准性更强

30、下列关于脏数据的说法中,正确的是( ABCDE)。66

A:格式不规范

B:编码不统一

C:意义不明确

D:与实际业务关系不大

E:数据不完整

31、数据再利用的意义在于( ABC)。90

A:挖掘数据的潜在价值

B:实现数据重组的创新价值

C:利用数据可扩展性拓宽业务领域

D:优化存储设备,降低设备成本

E:提高社会效益,优化社会管理

32、按照涉及自变量的多少,可以将回归分析分为(CD )。72

A:线性回归分析

B:非线性回归分析

C:一元回归分析

D:多元回归分析

E:综合回归分析

33、传统数据密集型行业积极探索和布局大数据应用的表现是( BCE)。37

A:投资入股互联网电商行业

B:打通多源跨域数据

C:提高分析挖掘能力

D:自行开发数据产品

E:实现科学决策与运营

34、大数据人才整体上需要具备(ABE )等核心(基本)知识。41

A:数学与统计知识

B:计算机相关知识

C:马克思主义哲学知识

D:市场运营管理知识

E:在特定业务领域的知识

35、下列关于大数据的说法中,错误的是(AD )。5

A:大数据具有体量大、结构单一、时效性强的特征

B:处理大数据需采用新型计算架构和智能算法等新技术

C:大数据的应用注重相关分析而不是因果分析

D:大数据的应用注重因果分析而不是相关分析

E:大数据的目的在于发现新的知识与洞察并进行科学决策

判断题(每题2分)

36、在噪声数据中,波动数据比离群点数据偏离整体水平更大。( F)67

37、对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。( F)

38、一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。(T )

39、具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求。(F ) 42

40、谷歌流感趋势充分体现了数据重组和扩展对数据价值的重要意义。( F)92

41、决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代表最终的分类结果,其优点在于易于实现,决策时间短,并且适合处理非数值型数据。( T)77

42、信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。( F)86

43、简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。( F)52

44、啤酒与尿布的经典案例,充分体现了实验(相关)思维在大数据分析理念中的重要性。(F )16

45、对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。( F)

(三)

单选题(每题2分)

1、下列关于舍恩伯格对大数据特点的说法中,错误的是(D)。5

A.数据规模大

B.数据类型多样

C.数据处理速度快

D.数据价值密度高(低)

2、下列关于大数据的分析理念的说法中,错误的是(D)8.9

A.在数据基础上倾向于全体数据而不是抽样数据

B.在分析方法上更注重相关分析而不是因果分析

C.在分析效果上更追求效率而不是绝对精确

D.在数据规模上强调相对数据而不是绝对数据

3、当前大数据技术的基础是由(C)首先提出的。

A.微软

B.百度

C.谷歌

D.阿里巴巴

4、下列关于大数据预测的说法中,错误的是(D)。17.18

A.人类的生活正在被大数据预测深刻改变

B.预测性分析是大数据最核心的功能

C.分析从“面向已经发生的过去”转向“面向即将发生的未来”是大数据与传统数据分析的最大

不同

D.大数据预测则是基本大数据和预测模型去预测过去某件某件事情的概率

5、下列演示方式中不属于传统统计图方式的是(D)。7

A.柱状图

B.饼形图

C.曲线图

D.网络图

6、一切事物及事物运动的状态,不仅销售数据、价格这些客观标准可以形成大数据,甚至连顾客情

绪(如色彩、空间的感知等)都可以测得,这体现了大数据思维维度中的(A)。10

A.定量思维

B.相关思维

C.因果思维

D.实验思维

7、下列国家的大数据发展行动中,坚持原则先行、谨慎发展的国家是(D)。24

A. 英国

B. 韩国

C. 印度

D. 澳大利亚

8、下列论句中,体现“冷眼”看大数据的观点是(D)。29.30

A.互联网金融打破了传统的观念和行为(无所不能)

B. 大数据医疗正在走进平民百姓(无所不能)

C. 数据资产型企业前景光明(无所不能)

D.个人隐私泄露与信息安全的担忧

9. 下列国家的大数据发展行动中,视大数据为新的自然资源的国家是(D)。24

A. 中国

B. 韩国

C. 印度

D. 新加坡

10. 下列论据中,能够支撑“大数据无所不能”的观点的是(A)。26.27

A. 互联网金融打破了传统的观念和行为

B. 大数据存在泡沫“冷眼”

C. 大数据具有非常高的成本“冷眼”

D. 个人隐私泄露与信息安全担忧“冷眼”

11. 美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的点。这体现了大数据分析理念中的(B)。9

A. 在数据基础上倾向于全体数据而不是抽样数据

B. 在分析方法上更注重相关分析而不是因果分析

C. 在分析效果上更追究效率而不是绝对精确

D. 在数据规模上强调相对数据而不是绝对数据

12. 大数据的最显著特征是(A)。5

A. 数据规模大

B. 数据类型多样

C. 数据处理速度快

D. 数据价值密度高

13.大数据环境下的隐私担忧,主要表现为(A)。31\48

A. 个人信息的被识别与暴露

B. 用户画像的生成

C. 恶意广告的推送

D. 病毒侵入

14. 下列国家的大数据发展行动中,集中体现“重视基础、首都先行”的国家是(D)。

A. 美国

B. 日本

C. 中国

D. 韩国

15.对线下零售而言,做好大数据分析应用的前提是(C)。17

A. 增加统计种类

B. 扩大营业面积

C. 增加数据来源

D. 开展优惠促销

16. 万维网之父是(C)

A. 彼得·德鲁克

B. 舍恩伯格

C. 蒂姆·伯纳斯—李

D. 斯科特·布朗

17. 万维网的实施国家是(B)

A. 英国

B. 美国

C. 德国

D. 印度

18.一切皆可连,任何数据之间逻辑上都有可能存在的联系,这体现大数据思维维度中的(B)。11

A. 定量思维

B. 相关思维

C. 因果思维

D. 实验思维

19.智慧城市的智慧之源是(C)。

A. 数字城市

B. 物联网

C. 大数据

D. 云计算

20. 一切皆可试,大数据分析的效果好坏,可能通过模拟仿真或者实际运行来验证,这体现大数据思维维中的(D)。11

A. 定量思维

B. 相关思维

C. 因果思维

D. 实验思维

21. 当前社会中,最为突出的大数据环境是(A)。

A. 互联网

B. 物联网

C. 综合国力

D. 自然资源

22.假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是(A)关系,而吸烟和肺癌则是(A)关系。8

A. 因果;相关

B. 相关;因果

C. 并列;相关

D. 因果;并列

23. 下列关于计算机存储容量单位的说法中,错误的是(C)。

A. 1KB<1MB<1GB

B. 基本单位是字节(Byte)

C. 一个汉字需要一(两)个字节的存储空间

D. 一个字节能够容纳一个英文字符

24. 智慧城市的构建,不包含(C)。

A. 数字城市

B. 物联网

C. 联网监控

D. 云计算

25.下列企业中,最有可能成为典型的数据资产运营商的是(D)。

A. 物联网企业

B. 互联网企业

C. 云计算企业

D. 电信运营商

多选题(每题3分)

26.下列关于大数据对政府政策制定的影响的说法中,错误的是(ACD )。12-13

A. 大数据有助于避免传统决策方式的随意性和主观性(对)

B. 大数据有效改变了政府的决策方式

C. 大数据可以完美解决一切政府政策制定难题

D. 大数据推动政府从基于“实证”的决策模式走向基于“经验”的决策模式

E. 大数据拓展了政府决策的信息边界条件

27. 当前大数据技术的基础包括(ABD)。6

A. 分布式文件系统

B. 分布式并行计算

C. 关系型数据库

D. 分布式数据库

E. 非关系型数据库

28. 下列关于大数据的说法中,错误的是(AD )。 5

A. 大数据具有体量大、结构单一、时效性强的特征

B. 处理大数据需采用新型计算架构和智能算法等新技术

C. 大数据的应用注重相关分析而不是因果分析

D. 大数据的应用注重因果分析而不是相关分析

E. 大数据的目的在于发现新的知识与洞察并进行科学决策

29. 下列关于大数据的说法中,错误的是(AD )。5

A. 大数据具有体量大、结构单一、时效性强的特征

B. 处理大数据需采用新型计算架构和智能算法等新技术

C. 大数据的应用注重相关分析而不是因果分析

D. 大数据的应用注重因果分析而不是相关分析

E. 大数据的目的在于发现新的知识与洞察并进行科学决策

30. 下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是(ABC)。

A. 传统营销模式比基于大数据的营销模式投入更小

B. 传统营销模式比基于大数据的营销模式针对性更强

C. 传统营销模式比基于大数据的营销模式转化率低

D. 基于大数据的营销模式比传统营销模式实时性更强

E. 基于大数据的营销模式比传统营销模式精准性更强

31.大数据的价值体现在(ABCDE)。

A. 大数据给思维方式带来了冲击

B. 大数据为政策制定提供科学依据

C. 大数据助力智慧城市提升公共服务水平

D. 大数据实现了精准营销

E. 大数据的发力点在于预测

32. 大数据的低耗能存储及高效率计算的要求,需要以下多种技术协同合作(ABCDE)。6

A. 分布式云存储技术

B. 高性能并行计算技术

C. 多元数据清洗及数据整合技术

D. 分布式文件系统及分布式并行数据库

E. 可视化高维展示技术

33. IBM公司用3个V来描述大数据的三个基本特征,这3V是(ACD)。5

A. 体量

B. 规模

C. 速度

D. 多样性

E. 复杂性

34. 可视化高维展示技术在展示数据之间的关系以及数据分析结果方面的作用是(BD)。7

A. 能够直观反映成对数据之间的空间关系

B.能够直观反映多维数据之间的空间关系

C. 能够静态演化事物的变化及变化的规律

D. 能够动态演化事物的变化及变化的规律

35. 下列关于云计算和数据库的说法中,错误的是(AE)。8

A. 获取样本的代价很高

B. 获取足够大的样本数据乃至全体数据非常容易

C. 比抽样调查数据更全面

D. 比抽样调查更能反映整个群体的特征与规律

E. 可以为发现新的商机机会提供决策支持

判断题(每题2分)

36. 对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同最好集中处理。(×)

37.啤酒与尿布的经典案例,充分体现了实验思维在大数据分析理念中的重要性。(×)

38.利用数据融合、数学模型、仿真技术等,可以逼近事物的本质,可以揭示出原来没有想到或难以展示的,大大解决政府决策的科学性。(√)13

39.在新加坡政府发展大数据的行动中,政府侧重于做好数据分析和服务,不承担数据提供服务。(×)

40.在美国的大数据大棋中,“五眼”是指配合美国进行全球监控的包含美国、英国、加拿大、荷兰在

内的五个国家。(×)

41.大数据预测能分析和挖掘出人们不知道或没有注意到的模式,确定判断某件事情必然会发生。(×)18

42.人们关心大数据,最终是关心大数据的应用,关心如何从业务和应用出发让大数据真正实现其所蕴含的价值,从而为人们的生产生活带来有益的改变。(√)10

43.当前,企业提供的大数据解决方案大多基于Ha doop开源项目。(√)33

44.澳大利亚政府视大数据为新的自然资源,积极承担数据提供者的角色,主动披露政府掌握的数据。(×)24

45. 从经济社会视角来看,大数据的重点在于“数据量大”。(×)19

大数据试题答案与解析_最全

1、当前大数据技术的基础是由( C)首先提出的。(单选题,本题2分) A:微软 B:百度 C:谷歌 D:阿里巴巴 2、大数据的起源是(C )。(单选题,本题2分) A:金融 B:电信 C:互联网 D:公共管理 3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是 ( C)。(单选题,本题2分) A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师 4、(D )反映数据的精细化程度,越细化的数据,价值越高。(单选题,本题2分) A:规模 B:活性 C:关联度 D:颗粒度 5、数据清洗的方法不包括( D)。(单,本题2分)

A:缺失值处理 B:噪声数据清除 C:一致性检查 D:重复数据记录处理 6、智能健康手环的应用开发,体现了( D)的数据采集技术的应用。(单选题,本题2分) A:统计报表 B:网络爬虫 C:API接口 D:传感器 7、下列关于数据重组的说法中,错误的是( A)。(单选题,本题2分) A:数据重组是数据的重新生产和重新采集 B:数据重组能够使数据焕发新的光芒 C:数据重组实现的关键在于多源数据融合和数据集成 D:数据重组有利于实现新颖的数据模式创新 8、智慧城市的构建,不包含( C)。(单选题,本题2分) A:数字城市 B:物联网 C:联网监控 D:云计算 大数据的最显著特征是( A)。(单选题,本题2分) A:数据规模大 B:数据类型多样

C:数据处理速度快 D:数据价值密度高 10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地 点。这体现了大数据分析理念中的(B )。(单选题,本题2分) A:在数据基础上倾向于全体数据而不是抽样数据 B:在分析方法上更注重相关分析而不是因果分析 C:在分析效果上更追究效率而不是绝对精确 D:在数据规模上强调相对数据而不是绝对数据 11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D )。(单选题,本题2分) A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高 12、当前社会中,最为突出的大数据环境是(A )。(单选题,本题2分) A:互联网 B:物联网 C:综合国力 D:自然资源 13、在数据生命周期管理实践中,( B)是(单选题,本题2分) A:数据存储和备份规 B:数据管理和维护 C:数据价值发觉和利用

大数据时代下的数据挖掘试题和答案及解析

A. 变量代换 B. 离散化 海量数据挖掘技术及工程实践》题目 、单选题(共 80 题) 1) ( D ) 的目的缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得 到 和原始数据相同的分析结果。 A. 数据清洗 B. 数据集成 C. 数据变换 D. 数据归约 2) 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数 据挖 掘的哪类问题 (A) A. 关联规则发现 B. 聚类 C. 分类 D. 自然语言处理 3) 以下两种描述分别对应哪两种对分类算法的评价标准 (A) (a) 警察抓小偷,描述警察抓的人中有多少个是小偷的标准。 (b) 描述有多少比例的小偷给警察抓了的标准。 据相分离 (B) 哪一类任务 (C) A. 根据内容检索 B. 建模描述 7) 下面哪种不属于数据预处理的方法 (D) A. Precision,Recall B. Recall,Precision A. Precision,ROC D. Recall,ROC 4) 将原始数据进行集成、 变换、维度规约、数值规约是在以下哪个步骤的任务 (C) 5) A. 频繁模式挖掘 C. 数据预处理 B. D. 当不知道数据所带标签时, 分类和预测 数据流挖掘 可以使用哪种技术促使带同类标签的数据与带其他标签的数 6) A. 分类 C. 关联分析 建立一个模型, B. D. 聚类 隐马尔可夫链 通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的 C. 预测建模 D. 寻找模式和规则

C.聚集 D. 估计遗漏值 8) 假设12 个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15 在第几个箱子内(B) A. 第一个 B. 第二个 C. 第三个 D. 第四个 9) 下面哪个不属于数据的属性类型:(D) A. 标称 B. 序数 C.区间 D. 相异 10) 只有非零值才重要的二元属性被称作:( C ) A. 计数属性 B. 离散属性 C.非对称的二元属性 D. 对称属性 11) 以下哪种方法不属于特征选择的标准方法:(D) A. 嵌入 B. 过滤 C.包装 D. 抽样 12) 下面不属于创建新属性的相关方法的是:(B) A. 特征提取 B. 特征修改 C. 映射数据到新的空间 D. 特征构造 13) 下面哪个属于映射数据到新的空间的方法(A) A. 傅立叶变换 B. 特征加权 C. 渐进抽样 D. 维归约 14) 假设属性income 的最大最小值分别是12000元和98000 元。利用最大最小规范化的方 法将属性的值映射到0 至 1 的范围内。对属性income 的73600 元将被转化为:(D) 15) 一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130 人,四年 级110 人。则年级属性的众数是:(A) A. 一年级 B. 二年级 C. 三年级 D. 四年级 16) 下列哪个不是专门用于可视化时间空间数据的技术:(B) A. 等高线图 B. 饼图

大数据题目及参考答案

公需科目大数据培训考试 考试时间:120分钟 选择题中红色代表正确答案,判断题X为错,R为对。 1.根据涂子沛先生所讲,摩尔定律是在哪一年提出的?(单选题1分) A.1988年 B.2004年 C.1965年 D.1989年 2.2015年,贵阳市的呼叫服务产业达到()坐席。(单选题1分) A.3万 B.5万 C.10万 D.20万 3.以下说法错误的是哪项?(单选题1分) A.大数据的思维方式遵循因果逻辑推理 B.摩尔定律是戈登?摩尔提出的 C.图灵测试是阿兰·图 D.ENIAC于1946年诞生 4.茂名PX事件发生后,下列哪个学校的化工系学生在网上进行了一场“PX词条保卫战”?(单选题1分) A.北大 B.清华 C.浙大 D.复旦 5.促进大数据发展部级联席会议在哪一年的4月13日召开了第一次会议?(单选题1分) A.2014年 B.2015年 C.2013年 D.2016年 6.根据涂子沛先生所讲,哪一年被称为大数据元年?(单选题1分) A.2012年 B.2010年 C.2008年 D.2006年 7.数据、信息与知识三者之间的变化趋势是(单选题1分) A.价值先增后减 B.价值递减 C.价值递增 D.价值不变 8.具体来说,摩尔定律就是每()个月,产品的性能将提高一倍。(单选题1分) A.18 B.16 C.12 D.6 9.“()大数据交易所”2015年4月14日正式运营,目前,交易所已有包括京东、华为、阿里巴巴等超过300家会员企业,交易总金额突破6000万元。(单选题1分)

A.毕节 B.安顺 C.贵阳 D.遵义 10.()说明如果联网越多,从介入方式、技术上越来越突破,则网络规模越大、成本越低,网络的成本可能会趋向于零。(单选题1分) A.吉尔德定律 B.摩尔定律 C.梅特卡尔夫定律 D.新摩尔定律 11.以下说法错误的是哪项?(单选题1分) A.大数据会带来机器智能 B.大数据不仅仅是讲数据的体量大 C.大数据的英文名称是large data D.大数据是一种思维方式 12.美国首个联邦首席信息官是下列哪位总统任命的?(单选题1分) A.克林顿 B.奥巴马 C.小布什 D.老布什 13.截至2015年年底,全国电话用户总数达到()。(单选题1分) A.13.37亿户 B.12.37亿户 C.14.37亿户 D.15.37亿户 14.2012年全国各城市支付宝人均支出排名中,位居第七位的是()(单选题1分) A.嘉兴市 B.台中市 C.高雄市 D.嘉义市 15.吴军博士认为过去五十年是()的时代。(单选题1分) A.科尔定律 B.艾尔定律 C.摩尔定律 D.拉尔定律 16.ENIAC诞生于哪一年?(单选题1分) A.1946年 B.1938年 C.1940年 D.1942年 17.梅特卡尔夫定律主要是描述信息网络,指出网络的价值在于网络的互联,联网的接点数与其价值呈现()的方式,联网越多,系统的价值越大。(单选题1分) A.正比 B.对数 C.指数 D.反比 18.根据周琦老师所讲,高德交通报告针对全国()个城市交通状态进行挖掘分析。(单选题1分) A.38 B.21 C.25 D.30 19.2012年全国各城市支付宝人均支出排名中,位居第三位的是()(单选题1分) A.嘉义市 B.杭州市 C.嘉兴市 D.高雄市

2017年公需科目大数据考试 所有测试题答案

2017年公需科目大数据考试所有测试题答案 (网上收集,经用过还可以,信不过可以不用) 网络时代的国家治理 1. 林雅华博士认为,“治理”是一个全新的政治概念,它既不同于“统治”,也不同 于“管理”。(正确) 2. 互联网时代最为典型的特征是扁平化、单一向度。(错误) 3. 林雅华博士认为,《舌尖上的中国》系列节目之所以获得成功,是网络时代的国家 治理让民众参与进来的有效体现。(正确) 4. 网络时代的国家治理应以文化人、以德化人、以礼化人。(正确) 5. 林雅华博士认为,在越来越复杂化的现代社会中,我们庞大的国家机器也许无法面 面俱到,如果能够广泛地征集群众的智慧,对国家治理而言不失为有效之道。(正确) 6. 我国下列哪些城市曾因PX项目问题发生过群体性事件?(多选题)(ABCD) A.大连 B.镇海 C.昆明 D.厦门 7. 茂名PX事件发生后,下列哪个学校的化工系学生在网上进行了一场“PX词条保卫战”?(单选题)(清华) 8. 林雅华博士指出,在网络时代,电子政务的发展刻不容缓。(正确) 9. 美国首个联邦首席信息官是下列哪位总统任命的?(单选题)(奥巴马) 10. 林雅华博士指出,Windows XP“停服”事件是一个事关我国信息安全的重大事件。(正确) 11. 林雅华博士指出,目前中国的是一个复杂社会,是一个转型社会。(正确) 大数据改变未来(学习笔记) 1. ENIAC诞生于哪一年?(1946年) 2. 大数据仅仅是指数据的体量大。(错误) 3. 吴军博士认为,所有未来的公司,某种程度上都是大数据公司。(正确) 4. 计算机是根据逻辑推理来回答天为什么是蓝色的。(错误) 5. 吴军博士认为机器无法取代人类成为放射科医生。(错误) 6. 大数据的思维会把原来销售的概念变成服务的概念。(正确) 7. 吴军博士认为,彻底解决保护个人隐私的问题,需要一些新的方法,比如双向监督的方法。(正确) 大数据在交通方面的应用(学习笔记) 1. 根据周琦老师所讲,高德交通信息服务覆盖(110)多个城市以及全国高速路网。 2. 根据周琦老师所讲,将大数据智能化融入高德地图,能够提供更精准的到达时间预 测和实时躲避拥堵功能。(正确) 3. 根据周琦老师所讲,通过索引技术,在分析具体问题时,可以回调出每条道路对应

2017贵州大数据考试题目和答案

2017贵州大数据考试题目和答案

? 1.大数据元年是指(单选题1分)得分:1分 o A.2010年 o B.2011年 o C.2012年 o D.2013年 ? 2.《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》提出,到2020年,统筹区域布局,依托现有资源建成()区域临床医学数据示范中心。(单选题1分)得分:1分 o A.100个 o B.200个 o C.300个 o D.400个

? 3.近几年,我国电子信息产业一直保持了()以上的年增长速度,成为国民经济各个领域中间的佼佼者。(单选题1分)得分:1分 o A.7% o B.8% o C.9% o D.10% ? 4.宁家骏委员指出,过去我们研制一个新型号的航天器,平均需要多长时间?(单选题1分)得分:1分 o A.1-2年 o B.3-4年 o C.5-6年 o D.7-8年

? 5.具体来说,摩尔定律就是每()个月,产品的性能将提高一倍。(单选题1分)得分:1分 o A.6 o B.12 o C.16 o D.18 ? 6.以下说法错误的是哪项?(单选题1分)得分:1分 o A.大数据是一种思维方式 o B.大数据不仅仅是讲数据的体量大 o C.大数据会带来机器智能 o D.大数据的英文名称是large data ?7.第一个提出大数据概念的公司是(单选题1分)得分:1分

o A.微软公司 o B.脸谱公司 o C.谷歌公司 o D.麦肯锡公司 ?8.大数据要求企业设置的岗位是(单选题1分)得分:0分 o A.首席分析师和首席工程师 o B.首席信息官和首席工程师 o C.首席分析师和首席数据官 o D.首席信息官和首席数据官 ?9.世界上第一台电子计算机(ENIAC)是在哪一年宣告诞生的?(单选题1分)得分:1分 o A.1946年 o B.1947年

大数据考试题含答案精编WORD版

大数据考试题含答案精 编W O R D版 IBM system office room 【A0816H-A0912AAAHH-GX8Q8-GNTHHJ8】

1 多选传统大数据质量清洗的特点有: A. 确定性 B. 强类型性 C. 协调式的 D. 非确定性 2 多选以下选项中属于数据的作用的是()。 A. 沟通 B. 验证假设 C. 建立信心 D. 欣赏 3 多选数据建立信心的作用需具备的条件包括()。 A. 可靠数据源 B. 多方的数据源 C. 合适的数据分析 D. 信得过的第三方单位 4 多选数据只有在与()的交互中才能发挥作用。

A. 人 B. 物 C. 消费者 D. 企业 5 单选大数据可能带来(),但未必能够带来()。 A. 精确度;准确度 B. 准确度;精确度 C. 精确度;多样性 D. 多样性;准确度 6 多选大数据的定义是: A. 指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合 B. 任何超过了一台计算机处理能力的数据量 C. 技术 D. 商业 7 多选大数据五大类应用方向是: A. 查询

B. 触达 C. 统计 D. 预警 E. 预测 8 多选以下哪些指标是衡量大数据应用成功的标准? A. 成本更低 B. 质量更高 C. 速度更快 D. 风险更低 9 多选大数据有哪些价值? A. 用户身份识别 B. 描述价值 C. 实时价值 D. 预测价值 E. 生产数据的价值 10 多选大数据的预测价值体现在:

A. 预测用户的偏好、流失 B. 预测热卖品及交易额 C. 预测经营趋势 D. 评价 11 单选什么是大数据使用的最可靠方法? A. 大数据源 B. 样本数据源 C. 规模大 D. 大数据与样本数据结合 12 多选大数据是描述()所发生的行为。 A. 未来 B. 现在 C. 过去 D. 实时 13 多选传统研究中数据采集的方法包括: A. 网络监测

大数据时代题目及答案(三套试题仅供参考)

大数据时代题目及答案(三套试题仅供参考)

第一套试题 1、当前大数据技术的基础是由(C)首先提出的。(单选题,本题2分) A:微软 B:百度 C:谷歌 D:阿里巴巴 2、大数据的起源是(C )。(单选题,本题2分) A:金融 B:电信 C:互联网 D:公共管理 3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是(C)。(单选题,本题2分) A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师 4、(D )反映数据的精细化程度,越细化的数据,价值越高。(单选题,本题2分) A:规模 B:活性 C:关联度 D:颗粒度 5、数据清洗的方法不包括( D)。(单选题,本题2分) A:缺失值处理 B:噪声数据清除 C:一致性检查 D:重复数据记录处理 6、智能健康手环的应用开发,体现了( D)的数据采集技术的应用。(单选题,本题2分) A:统计报表 B:网络爬虫 C:API接口 D:传感器 7、下列关于数据重组的说法中,错误的是(A)。(单选题,本题2分) A:数据重组是数据的重新生产和重新采集 B:数据重组能够使数据焕发新的光芒 C:数据重组实现的关键在于多源数据融合和数据集成 D:数据重组有利于实现新颖的数据模式创新 8、智慧城市的构建,不包含( C)。(单选题,本题2分) A:数字城市 B:物联网 C:联网监控 D:云计算 9、大数据的最显著特征是(A)。(单选题,本题2分) A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的(B )。(单选题,本题2分) A:在数据基础上倾向于全体数据而不是抽样数据 B:在分析方法上更注重相关分析而不是因果分析 C:在分析效果上更追究效率而不是绝对精确 D:在数据规模上强调相对数据而不是绝对数据 11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D)。(单选题,本题2分) A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高12、当前社会中,最为突出的大数据环境是(A)。(单选题,本题2分) A:互联网 B:物联网 C:综合国力 D:自然资源 13、在数据生命周期管理实践中,( B)是执行方法。(单选题,本题2分) A:数据存储和备份规范 B:数据管理和维护 C:数据价值发觉和利用 D:数据应用开发和管理 14、下列关于网络用户行为的说法中,错误的是(C)。(单选题,本题2分) A:网络公司能够捕捉到用户在其网站上的所有行为 B:用户离散的交互痕迹能够为企业提升服务质量提供参考 C:数字轨迹用完即自动删除 D:用户的隐私安全很难得以规范保护 15、下列关于计算机存储容量单位的说法中,错误的是( C)。(单选题,本题2分) A:1KB<1MB<1GB B:基本单位是字节(Byte) C:一个汉字需要一个字节的存储空间 D:一个字节能够容纳一个英文字符, 16、下列关于聚类挖掘技术的说法中,错误的是(B)。(单选题,本题2分) A:不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别

《大数据时代下的数据挖掘》试题及答案..

《海量数据挖掘技术及工程实践》题目 一、单选题(共80题) 1)( D )的目的缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到 和原始数据相同的分析结果。 A.数据清洗 B.数据集成 C.数据变换 D.数据归约 2)某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖 掘的哪类问题?(A) A. 关联规则发现 B. 聚类 C. 分类 D. 自然语言处理 3)以下两种描述分别对应哪两种对分类算法的评价标准? (A) (a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。 (b)描述有多少比例的小偷给警察抓了的标准。 A. Precision,Recall B. Recall,Precision A. Precision,ROC D. Recall,ROC 4)将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C) A. 频繁模式挖掘 B. 分类和预测 C. 数据预处理 D. 数据流挖掘 5)当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数 据相分离?(B) A. 分类 B. 聚类 C. 关联分析 D. 隐马尔可夫链 6)建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的 哪一类任务?(C) A. 根据内容检索 B. 建模描述 C. 预测建模 D. 寻找模式和规则 7)下面哪种不属于数据预处理的方法? (D) A.变量代换 B.离散化

C.聚集 D.估计遗漏值 8)假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内? (B) A.第一个 B.第二个 C.第三个 D.第四个 9)下面哪个不属于数据的属性类型:(D) A.标称 B.序数 C.区间 D.相异 10)只有非零值才重要的二元属性被称作:( C ) A.计数属性 B.离散属性 C.非对称的二元属性 D.对称属性 11)以下哪种方法不属于特征选择的标准方法: (D) A.嵌入 B.过滤 C.包装 D.抽样 12)下面不属于创建新属性的相关方法的是: (B) A.特征提取 B.特征修改 C.映射数据到新的空间 D.特征构造 13)下面哪个属于映射数据到新的空间的方法? (A) A.傅立叶变换 B.特征加权 C.渐进抽样 D.维归约 14)假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方 法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:(D) A.0.821 B.1.224 C.1.458 D.0.716 15)一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年 级110人。则年级属性的众数是: (A) A.一年级 B.二年级 C.三年级 D.四年级

大数据试题及答案

第一组试题 一、选择题 1、以下哪个不是大数据的特征(C ) A. 价值密度低 B. 数据类型繁多 C.访问时间短 D. 处理速度快 2、当前大数据技术的基础是由( C )首先提出的。(单选题,本题2 分)A:微软 B:百度 C:谷歌 D:阿里巴巴 3、大数据的起源是(C )。(单选题,本题2 分) A:金融 B:电信 C:互联网 D:公共管理 4、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( C )。(单选题,本题 2 分) A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师 5、(C )反映数据的精细化程度,越细化的数据,价值越高。(单选题,本题 2 分) A:规模 B:活性 C:颗粒度 D:关联度 6、智能健康手环的应用开发,体现了( C )的数据采集技术的应用。(单选 题,本题 2 分) A:统计报表 B:网络爬虫 C:传感器 D:API 接口 7、下列关于数据重组的说法中,错误的是(C )。(单选题,本题2 分)A:数据重组实现的关键在于多源数据融合和数据集成 B:数据重组能够使数据焕发新的光芒 C:数据重组是数据的重新生产和重新采集 D:数据重组有利于实现新颖的数据模式创新

8、智慧城市的构建,不包含(C )。(单选题,本题2 分) A:数字城市 B:物联网 C:联网监控 D:云计算 9、当前社会中,最为突出的大数据环境是(C )。(单选题,本题2 分)A:综合国力 B:物联网 C:互联网 D:自然资源 二、判断题 1.对于大数据而言,最基本。最重要的是要求就是减少错误、保证质量。因此,大数据收集的信息要尽量精确。() 2. 对于大数据而言,在数据规模上强调相对数据而不是绝对数据。() 3.基于大数据的营销模式和传统营销模式,传统营销模式比大数据营销模式投入更小。() 4.大数据具有体量大、结构单一、时效性强的特征。() 三、简答题 1.大数据发展过程中遇到的问题有哪些? 解析: (1)大数据是全数据,忽视甚至蔑视抽样; (2)连续数据就是大数据; (3)数据量级大是大数据; (4)数据量大好于量小。 2.咸鱼APP在投入使用发展过程中有哪些不足之处? 解析: (1)交易信任危机 (2)物流问题 (3)商品的售后及维修问题

2018年大数据时代的互联网信息安全试题和答案解析(100分)

1.网盘是非常方便的电子资料存储流转工具。不仅不占用空间,而且在任何电脑上都能访问,下面这些使用网盘的做法中,哪一项会造成个人隐私信息泄露的风险?()(单选题2分) 得分:2分 C.将所有信息保存在云盘,设置一个复杂的云盘密码,然后将密码信息保存在电脑D 盘的文件夹中 2.位置信息和个人隐私之间的关系,以下说法正确的是()(单选题2分)得分:2分 C.需要平衡位置服务和隐私的关系,认真学习软件的使用方法,确保位置信息不泄露 3.你收到一条10086发来的短信,短信内容是这样的:“尊敬的用户,您好。您的手机号码实名制认证不通过,请到XXXX网站进行实名制验证,否则您的手机号码将会在24小时之内被停机”,请问,这可能是遇到了什么情况?()(单选题2分)得分:2分 D.伪基站诈骗 4.我们在日常生活和工作中,为什么需要定期修改电脑、邮箱、网站的各类密码?()(单选题2分)得分:2分 D.确保个人数据和隐私安全 5.浏览网页时,弹出“最热门的视频聊天室”的页面,遇到这种情况,一般怎么办?()(单选题2分)得分:2分 D.弹出的广告页面,风险太大,不应该去点击 6.在某电子商务网站购物时,卖家突然说交易出现异常,并推荐处理异常的客服人员。以下最恰当的做法是?()(单选题2分)得分:2分 C.通过电子商务官网上寻找正规的客服电话或联系方式,并进行核实 7.重要数据要及时进行(),以防出现意外情况导致数据丢失。(单选题2分)得分:2分 C.备份 8.我国计算机信息系统实行()保护。(单选题2分)得分:2分 B.安全等级 9.当前网络中的鉴别技术正在快速发展,以前我们主要通过账号密码的方式验证用户身份,现在我们会用到U盾识别、指纹识别、面部识别、虹膜识别等多种鉴别方式。请问下列哪种说法是正确的。()(单选题2分)得分:2分 C.使用多种鉴别方式比单一的鉴别方式相对安全 10.日常上网过程中,下列选项,存在安全风险的行为是?()(单选题2分)得分:2

大数据考试答案

1、当前大数据技术的基础是由(C)首先提出的。(单选题,本题2分) A:微软 B:百度 C:谷歌 D:阿里巴巴 2、大数据的起源是(C )。(单选题,本题2分) A:金融 B:电信 C:互联网 D:公共管理 3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是 (C)。(单选题,本题2分) A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师 4、(D )反映数据的精细化程度,越细化的数据,价值越高。(单选题,本题2分) A:规模 B:活性 C:关联度 D:颗粒度

5、数据清洗的方法不包括(D)。(单选题,本题2分) A:缺失值处理 B:噪声数据清除 C:一致性检查 D:重复数据记录处理 6、智能健康手环的应用开发,体现了(D)的数据采集技术的应用。(单选题,本题2分) A:统计报表 B:网络爬虫 C:API接口 D:传感器 7、下列关于数据重组的说法中,错误的是(A)。(单选题,本题2分) A:数据重组是数据的重新生产和重新采集 B:数据重组能够使数据焕发新的光芒 C:数据重组实现的关键在于多源数据融合和数据集成 D:数据重组有利于实现新颖的数据模式创新 8、智慧城市的构建,不包含(C)。(单选题,本题2分) A:数字城市 B:物联网 C:联网监控 D:云计算 9、大数据的最显著特征是(A)。(单选题,本题2分)

A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高 10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地 点。这体现了大数据分析理念中的(B )。(单选题,本题2分) A:在数据基础上倾向于全体数据而不是抽样数据 B:在分析方法上更注重相关分析而不是因果分析 C:在分析效果上更追究效率而不是绝对精确 D:在数据规模上强调相对数据而不是绝对数据 11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D )。(单选题,本题2分) A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高 12、当前社会中,最为突出的大数据环境是(A )。(单选题,本题2分) A:互联网 B:物联网 C:综合国力 D:自然资源

大数据时代题目及答案(三套试题仅供参考)111

第一套试题 1、当前大数据技术的基础是由( C)首先提出的。(单选题,本题2分) A:微软 B:百度 C:谷歌 D:阿里巴巴 2、大数据的起源是(C )。(单选题,本题2分) A:金融 B:电信 C:互联网 D:公共管理 3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是( C)。(单选题,本题2分) A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师 4、(D )反映数据的精细化程度,越细化的数据,价值越高。 A:规模 B:活性 C:关联度 D:颗粒度 5、数据清洗的方法不包括( D)。(单选题,本题2分) A:缺失值处理 B:噪声数据清除 C:一致性检查 D:重复数据记录处理 6、智能健康手环的应用开发,体现了( D)的数据采集技术的应用。 A:统计报表 B:网络爬虫 C:接口 D:传感器 7、下列关于数据重组的说法中,错误的是( A)。(单选题,本题2分) A:数据重组是数据的重新生产和重新采集 B:数据重组能够使数据焕发新的光芒 C:数据重组实现的关键在于多源数据融合和数据集成 D:数据重组有利于实现新颖的数据模式创新 8、智慧城市的构建,不包含( C)。(单选题,本题2分) A:数字城市 B:物联网 C:联网监控 D:云计算 9、大数据的最显著特征是( A)。(单选题,本题2分)

A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高 10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的(B )。(单选题,本题2分) A:在数据基础上倾向于全体数据而不是抽样数据 B:在分析方法上更注重相关分析而不是因果分析 C:在分析效果上更追究效率而不是绝对精确 D:在数据规模上强调相对数据而不是绝对数据 11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D )。(单选题,本题2分) A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高 12、当前社会中,最为突出的大数据环境是(A )。(单选题,本题2分) A:互联网 B:物联网 C:综合国力 D:自然资源13、在数据生命周期管理实践中,( B)是执行方法。(单选题,本题2分) A:数据存储和备份规范 B:数据管理和维护 C:数据价值发觉和利用 D:数据应用开发和管理 14、下列关于网络用户行为的说法中,错误的是( C)。(单选题,本题2分) A:网络公司能够捕捉到用户在其网站上的所有行为 B:用户离散的交互痕迹能够为企业提升服务质量提供参考 C:数字轨迹用完即自动删除 D:用户的隐私安全很难得以规范保护

大数据考试题含答案知识讲解

1 多选传统大数据质量清洗的特点有: A. 确定性 B. 强类型性 C. 协调式的 D. 非确定性 2 多选以下选项中属于数据的作用的是()。 A. 沟通 B. 验证假设 C. 建立信心 D. 欣赏 3 多选数据建立信心的作用需具备的条件包括()。 A. 可靠数据源 B. 多方的数据源 C. 合适的数据分析 D. 信得过的第三方单位 4 多选数据只有在与()的交互中才能发挥作用。 A. 人 B. 物 C. 消费者 D. 企业 5 单选大数据可能带来(),但未必能够带来()。 A. 精确度;准确度 B. 准确度;精确度 C. 精确度;多样性 D. 多样性;准确度 6 多选大数据的定义是: A. 指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合 B. 任何超过了一台计算机处理能力的数据量 C. 技术 D. 商业 7 多选大数据五大类应用方向是: A. 查询 B. 触达 C. 统计 D. 预警 E. 预测 8 多选以下哪些指标是衡量大数据应用成功的标准? A. 成本更低 B. 质量更高 C. 速度更快 D. 风险更低 9 多选大数据有哪些价值? A. 用户身份识别

B. 描述价值 C. 实时价值 D. 预测价值 E. 生产数据的价值 10 多选大数据的预测价值体现在: A. 预测用户的偏好、流失 B. 预测热卖品及交易额 C. 预测经营趋势 D. 评价 11 单选什么是大数据使用的最可靠方法? A. 大数据源 B. 样本数据源 C. 规模大 D. 大数据与样本数据结合 12 多选大数据是描述()所发生的行为。 A. 未来 B. 现在 C. 过去 D. 实时 13 多选传统研究中数据采集的方法包括: A. 网络监测 B. 电话访谈 C. 对面访谈 D. 线上互动 14 单选大数据整合要保证各个数据源之间的()。 A. 一致性、协调性 B. 差异性、协调性 C. 一致性、差异性 D. 一致性、相容性 15 单选分类变量使用()建立预测模型。 A. 决策树 B. 分类树 C. 离散树 D. 回归树 16 多选()是大数据应用的步骤。 A. 数据输入 B. 建模分析 C. 使用决策支持工具输出结果 D. 验证假设 17 多选避免“数据孤岛”的方法包括: A. 关键匹配变量 B. 数据融合 C. 数据输入 D. 利用样本框

大数据考试答案36830

1、规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据, 这指的就是()。(单选题1分) o A、富数据 o B、贫数据 o C、繁数据 o D、大数据 ?2、世界上第一台电子计算机(ENIAC)就是在哪一年宣告诞生的?(单选题1分)得分:1分 o A、1946年 o B、1949年 o C、1948年 o D、1947年 ?3、“最为成功的商业运作模式就是价格最低的资源将会被尽可能的消耗,以此来保存最昂贵的资源”,这就是下列哪个定律的内涵?(单选题1分)得分:1分o A、麦特卡尔夫定律 o B、摩尔定律 o C、吉尔德定律 o D、牛顿定律 ?4、第一个提出大数据概念的公司就是( )。(单选题1分)得分:1分

o A、麦肯锡公司 o B、谷歌公司 o C、脸谱公司 o D、微软公司 ?5、()年3月1日,贵州·北京大数据产业发展推介会在北京隆重举行,贵州大数据正式启航。(单选题1分)得分:1分 o A、2012 o B、2014 o C、2010 o D、2016 ?6、大数据要求企业设置的岗位就是(单选题1分)得分:1分 o A、首席信息官与首席数据官 o B、首席分析师与首席数据官 o C、首席分析师与首席工程师 o D、首席信息官与首席工程师 ?7、()指利用计算机处理信息的技术,就是现代信息技术的核心。(单选题1分)得分:1分 o A、计算机技术 o B、感测技术 o C、通信技术

o D、微电子技术 ?8、2015年,贵阳市的呼叫服务产业达到()坐席。(单选题1分)得分:1分o A、20万 o B、10万 o C、5万 o D、3万 ?9、《国务院办公厅关于促进农村电子商务加快发展的指导意见》要求:到()年,初步建成统一开放、竞争有序、诚信守法、安全可靠、绿色环保的农村电子商务市场体系。(单选题1分)得分:1分 o A、2030年 o B、2035年 o C、2025年 o D、2020年 ?10、医疗健康数据的基本情况不包括以下哪项?(单选题1分)得分:1分o A、个人健康管理数据 o B、健康档案数据 o C、诊疗数据 o D、公共安全数据 ?11、关于大数据在社会综合治理中的作用,以下理解不正确的就是( )。(单选题1分)得分:0分

《我们的大数据时代》考试题目及答案

我们的大数据时代 (一) 单选题(每题2分) 1. 下列关于舍恩伯格对大数据特点的说法中,错误的是(D) A. 数据规模大 B. 数据类型多样 C. 数据处理速度快 D. 数据价值密度高 2. 下列关于大数据的分析理念的说法中,错误的是(D) A. 在数据基础上倾向于全体数据而不是抽样数据 B. 在分析方法上更注重相关分析我不是因果分析 C. 在分析效果上更追究效率而不是绝对精确 D. 在数据规模上强调相对数据而不是绝对数据 3. 万维网之父是(C) A. 彼得·德鲁克 B. 舍恩伯格 C. 蒂姆·伯纳斯—李 D. 斯科特·布朗 4. 下列关于普查的缺点的说法中,正确的是(A)。 A. 工作量较大,容易导致调查内容有限、产生重复和遗漏现象 B. 误差不易被控制 C. 对样本的依赖性比较强 D. 评测结果不够稳定 5.下列关于聚类挖掘技术的说法中,错误的是(B)。 A. 不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别 B. 要求同类数据的内容相似度尽可能小 C. 要求不同类数据的内容相似度尽可能小 D. 与分类挖掘技术相似的是,都是要对数据进行分类处理 6. 智慧城市的构建,不包含(C)。 A. 数字城市 B. 物联网 C. 联网监控 D. 云计算 7.大数据的起源是(C)。 A. 金融 B. 电信 C. 互联网 D. 公共管理 8. 智慧城市的智慧之源是(C)。 A. 数字城市 B. 物联网 C. 大数据 D. 云计算 9. 假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是(A)关系,而吸烟和肺癌则是(A)关系。

A. 因果;相关 B. 相关;因果 C. 并列;相关 D. 因果;并列 10. 下列关于数据交易市场的说法中,错误的是(C)。 A. 数据交易市场是大数据产业发展到一定程度的产物 B. 商业化的数据交易活动催生了多方参与的第三方数据交易市场 C. 数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助 D. 数据交易市场是大数据资源化的必然产物 11. 下列关于计算机存储容量单位的说法中,错误的是(C)。 A. 1KB<1MB<1GB B. 基本单位是字节(Byte) C. 一个汉字需要一个字节的存储空间 D. 一个字节能够容纳一个英文字符 12. 当前大数据技术的基础是由(C)首先提出的。 A. 微软 B. 百度 C. 谷歌 D. 阿里巴巴 13. 下列国家的大数据发展行动中,集中体现“重视基础、首都先行”的国家是(D)。 A. 美国 B. 日本 C. 中国 D. 韩国 14. 下列演示方式中,不属于传统统计图方式的是(D)。 A. 柱状图 B. 饼状图 C. 曲线图 D. 网络图 15. 当前社会中,最为突出的大数据环境是(A)。 A. 互联网 B. 物联网 C. 综合国力 D. 自然资源 16. 可以对大数据进行深度分析的平台工具是(C)。 A. 传统的机器学习和数据分析工具 B. 第二代机器学习工具 C. 第三代机器学习工具 D. 未来机器学习工具 17. 智能健康手环的应用开发,体现了(D)的数据采集技术的应用。 A. 统计报表 B. 网络爬虫 C. API接口 D. 传感器 18. 过一系列处理,在基本保持原始数据完整性的基础上,减小数据规模的是(C)。 A. 数据清洗

大数据基础技能试题及答案

Java基础 1. Which of the following will compile correctly? A) float f=10f; B) float f=10.1; C) float f=10.1f; D) byte b=10b; 2. Which declarations of identifiers are legal A. $persons B. TwoUsers C. *point D. this E. _endline 3. Which statement of assigning a long type variable to a hexadecimal value is correct A. long number = 345L; B. long number = 0345; C. long number = 0345L; D. long number = 0x345L 4. Which of the following fragments might cause errors A. String s = "Gone with the wind"; String t = " good "; String k = s + t; B. String s = "Gone with the wind"; String t; t = s[3] + "one"; C. String s = "Gone with the wind"; String standard = s.toUpperCase(); D. String s = "home directory"; String t = s - "directory"; 5. Which are syntactically valid statement at// point x class Person { private int a; public int change(int m){ return m; } }

大数据考试题含答案

1 多选传统大数据质量清洗得特点有: A、确定性 B、强类型性 C、协调式得 D、非确定性 2 多选以下选项中属于数据得作用得就是()。 A、沟通 B、验证假设 C、建立信心 D、欣赏 3 多选数据建立信心得作用需具备得条件包括( )。 A、可靠数据源 B、多方得数据源 C、合适得数据分析 D、信得过得第三方单位 4 多选数据只有在与( )得交互中才能发挥作用。 A、人 B、物 C、消费者 D、企业 5 单选大数据可能带来( ),但未必能够带来( )。 A、精确度;准确度 B、准确度;精确度 C、精确度;多样性 D、多样性;准确度 6 多选大数据得定义就是: A、指无法在可承受得时间范围内用常规软件工具进行捕捉、管理与处理得数据集合 B、任何超过了一台计算机处理能力得数据量 C、技术 D、商业 7 多选大数据五大类应用方向就是: A、查询 B、触达 C、统计 D、预警 E、预测 8 多选以下哪些指标就是衡量大数据应用成功得标准? A、成本更低 B、质量更高 C、速度更快 D、风险更低 9 多选大数据有哪些价值? A、用户身份识别

B、描述价值 C、实时价值 D、预测价值 E、生产数据得价值 10 多选大数据得预测价值体现在: A、预测用户得偏好、流失 B、预测热卖品及交易额 C、预测经营趋势 D、评价 11单选什么就是大数据使用得最可靠方法? A、大数据源 B、样本数据源 C、规模大 D、大数据与样本数据结合 12 多选大数据就是描述( )所发生得行为。A、未来 B、现在 C、过去 D、实时 13多选传统研究中数据采集得方法包括: A、网络监测 B、电话访谈 C、对面访谈 D、线上互动 14 单选大数据整合要保证各个数据源之间得( )。A、一致性、协调性 B、差异性、协调性 C、一致性、差异性 D、一致性、相容性 15 单选分类变量使用( )建立预测模型。 A、决策树 B、分类树 C、离散树 D、回归树 16多选 ( )就是大数据应用得步骤。 A、数据输入 B、建模分析 C、使用决策支持工具输出结果 D、验证假设 17 多选避免“数据孤岛”得方法包括: A、关键匹配变量 B、数据融合 C、数据输入 D、利用样本框

相关文档
相关文档 最新文档