文档库 最新最全的文档下载
当前位置:文档库 › 大数据的本体假设及其客观本质_黄欣荣

大数据的本体假设及其客观本质_黄欣荣

大数据的本体假设及其客观本质_黄欣荣
大数据的本体假设及其客观本质_黄欣荣

第33卷,第2期科学技术哲学研究

Vol.33No.2

2016年4月Studies in Philosophy of Science and Technology Apr.,

2016·科技与社会·

【收稿日期】2015-10-12

【基金项目】国家社会科学基金重点课题“大数据技术革命的哲学问题研究”(2014AZX006)

【作者简介】黄欣荣(1962-),男,江西赣州人,江西财经大学管理哲学研究中心教授、博士生导师,研究方向为大数据哲学、

复杂性哲学等。

大数据的本体假设及其客观本质

黄欣荣

(江西财经大学管理哲学研究中心,南昌330013)

摘要:随着大数据的兴起,数据的本质发生了巨大的变化。大数据认为,“万物皆数”,世界万物最终都可以

还原为数据,数据因此成为世界的本质;万物皆可用数据表达,“量化一切”是大数据的终极目标;数据是信息的普适表征方式和新的实在形式,它是物质世界的映射,具有波普尔世界3的客观实在性。大数据让世界变成了一个数据化的世界,而数据挖掘让我们可以完全认知这个数据世界,由此世界变成了透明世界。

关键词:大数据;本体论;数据本质;数据实在;透明世界中图分类号:N031

文献标识码:A

文章编号:1674-7062(2016)02-0090-05

大数据是近年来迅速发展起来的一种数据新技术,这场数据技术革命给我们不但带来了新的认知

方式、思维方式、价值观念和伦理道德,而且可能彻底改变我们的世界观,带来全新的世界本体假设。[1]

数据从事物的表征符号逐渐成为世界的本质特征,大千世界也可能变成一个由数据构成并为人类所认知和掌控的透明世界。目前,学术界更多关注大数据带来的产业变革和伦理危机,而对大数据带来的哲学本体论的影响则关注较少。[2]

本文试图对大数据的本体假设及其终极目标进行初步的描绘,并通过对数据与信息、数据与物质以及数据与客观知识之间关系的辨析对数据本质进行探讨。

一万物皆数:大数据的本体假设

世界究竟是什么?这是哲学家们一直特别关注

的重大问题,也是我们通常所说的本体论问题。大数据革命带来了一场认识论和方法论的新变革,我们自然就有必要关注大数据的本体论主张。早在古希腊时期,毕达哥拉斯就认识到“数”的本体论地位。作为一位数学家,他关注事物之间的数量关系,并且由于酷爱音乐而特别关注事物之间

的和谐比例关系,因此他认为世界的本原或始基并

不是具体的物质,而是表征物质之间关系的“数”。毕达哥拉斯由此提出了“万物皆数”这样一个看似

异类的观点,由此将表征事物及其关系的数据符号上升为具有本体论意义的万物始基。

[3]

无独有偶,在古老的中国,“数”很早就被当作

揭示和解释宇宙秘密的工具,甚至被当作世界的本质。据说中国的上古先民就根据龟壳烧烤后的裂纹,然后又进化为蓍草组合的占卜来解释吉凶祸福,由此发展出由阳爻(—

——)和阴爻(--)符号组合而成的易经。易经由相互对立的两个东西(例如正和负)经三组排列成八卦,八卦再组合成64卦,由此类推以至无穷。中国古代哲学家老子将易经发展为代表其基本主张的哲学体系,认为由阴阳出发的五行、八卦等描述了世界的基本规律,阴阳是万物最基本的构成要素,阴阳存在于万物之中,是世界的本体

。“道生一,一生二,二生三,三生万物。万物负阴而抱阳,冲气以为和。”[4]按照这个模式,世界从无到有,阴阳交互而生万物。后来的儒家、道家、阴

阳家将易经发展为一整套哲学体系,特别是河书、洛图更是将宇宙万物与1、

2、3等几个简单的数字联系0

9

在一起,并生成一个复杂的宇宙世界。

在中世纪,数据的哲学地位不是特别突出,但《圣经》中依然提到语言的巨大作用,甚至将其提升到与神同在的地步。《新约·约翰福音》里说,太初有道(word),道与神同在,这是将世界的根源归结为“道”(语言)。[5]8用现在的眼光来看,语言表述就是一种信息,而信息可以转化为数据,因此语言也是一种数据。由此可见,圣经对“道”的强调其实也就是对数据的强调。

文艺复兴之后,近代科学发展迅速,特别是经验主义重视受控实验、数据收集与处理,这极大地促进了科学的发展,数据的地位也得到了极大的重视。例如,牛顿把数据、数学作为科学研究的重要工具,莱布尼兹则提出了其著名的“单子论”,而康德则将“量”“质”当作科学认识的四大类基本范畴之首。不过,此时的西方近代哲学发生了重大转向,兴趣重心从本体论转向了认识论。这就是说,西方近代哲学不再像古代哲学那样重点关注世界是什么的问题,而是关心我们怎样去认识这个世界,怎样才能获得对世界的认知。因此,数据在近代哲学的认识论中虽然获得了特殊地位,但它仅仅被当作科学认识的工具,其本体地位并没有什么突破,甚至从古代的本体地位下降到了工具理性的地位。

数据本体地位的突破发生在现代信息论的诞生之后。20世纪40年代中期,美国科学家诺伯特·维纳和克劳德·香农分别同时提出了信息论思想。在信息论刚刚创立之时,维纳和香农都没有给出信息的明确定义,维纳只是说:“信息就是信息,它既不是物质,也不是能量。”[6]他在这里将物质、能量、信息三者相提并论,信息的独立地位就由此凸显了出来。由于信息论的诞生,信息从科学上获得了独立的本体地位,它成为构成世界的三剑客之一。从此,人们开始认识到,信息是宇宙固有的组成部分,就像物质、能量一样。正如詹姆斯·格雷克所说:“信息是我们这个世界所依赖的食物和生命力。”[5]5信息是对事物状态差异度的一种刻画,而“数据代表着对某件事物的描述”[7]104。由此可见,信息和数据具有一定的等价性,因此,信息论对信息独立本体地位的论述,也就间接论证了数据的独立本体地位。

20世纪下半叶,随着计算机技术、人工智能和其他智能设备的发展以及互联网络的建立,数据的地位一下子凸显出来。21世纪的智能手机、移动网络、智能终端、物联网的广泛使用,数据的规模一下子呈暴增之势,而云存储、云计算等技术又为数据存储和挖掘提供了可行的技术手段,于是,我们一下子从小数据时代迅速步入了大数据时代。在大数据时代,数据成了时代的核心,成为一种与土地、矿产、石油等自然资源一样重要的新型资源,数据的本体地位更加凸显出来。

大数据作为一场数据技术革命,数据被提高到前所未有的高度,成为一种形而上学的信念和本体论的基本假设。大数据认为,数据已经不再仅仅是一种事物及其关系的表征符号,而是世界的本质。英国大数据权威维克托·舍恩伯格认为世界的本质就是数据。“有了大数据的帮助,我们不会再将世界看作是一连串我们认为或是自然或是社会现象的事件,我们会意识到本质上世界是由信息构成的。”[7]125他还引用物理学家约翰·阿奇博尔德·惠勒的话说:“并非原子而是信息才是一切的本原。”[7]125惠勒用了一句颇具神谕意味的话语:“万物源于比特(It from Bit)。”[5]7比特生存在,是圣经说法的新版本。“比特是另一种类型的基本粒子:它不仅微小,而且抽象———它存在于一个个二进制数字、一个个触发器、一个个‘是’或‘否’的判断里。它看不见摸不着,但科学家最终开始理解信息时,他们好奇信息是否才是真正基本的东西,甚至比物质本身更基本。”[5]7大数据认为,世界上的万事万物及其关系都可以用数据来表征,用更简洁的话来说:“万物皆数据”。这就是舍恩伯格所说的“世界的本质是数据”的含义,也是大数据的本体论假设。因此,大数据时代来临的标志并不仅仅是数据规模变得特别巨大(因为数据规模的大小并没有一个绝对标准),其真正的标志,或者说真正的革命表现在数据观的革命,也就是本体论假设的变革,“万物皆数”成为大数据时代本体论的基本假设。

二量化一切:大数据的终极追求

在大数据时代,数据的本体地位得到了张扬,从描述事物的符号变成了世界万物的本质属性之一。在大数据看来,物质的世界同时也是一个数据的世界,因此对世界万物的数据化成为大数据的终极性追求。换句话来说,大数据试图“量化一切”,把万物变成数据,并通过数据来认识和把握万物。

从粗略来划分,人类数据化的历史大概可分为财富量化、自然量化和人文量化三个阶段。为了更精准地描述、记录和理解事物,人们很早就开始了对事物数据化的历程。财富的记录和计算,是人们最

19

早迫切需要精确计量和计算的领域,因此人类最早的量化工作,或者说数据化工作,就是从财富的量化开始的。后来广泛进行的人口统计、财产登记、会计核算等国家统计行为,都是人类早期的数据化工作。“计量和记录一起促成了数据的诞生,它们是数据化最早的根基。”[7]105所以,财富的数字化和计量化,促使了人类对事物认识的精确化和数据化。难怪格雷克会说,普罗米修斯赠予人类的最宝贵的礼物,并不是人们常说的火种,而是数字和字母:“我(普罗米修斯)为人类发明了数,这是所有科学中最最重要的,还有排列字母的技术,这是缪斯诸艺的创造之母,借此可以把一切牢牢记住。”[5]8

自文艺复兴开始,科学技术获得了突飞猛进的发展,而其推动力主要就是对自然的数据化,或者说叫量化自然。在文艺复兴以前,人类的量化或数据化的工作主要还停留在财富的数据化,而文艺复兴后,人类就开始了对自然界及其各种现象的数据化。近代科学的兴起,跟受控实验和归纳法的兴起有着极大的关系。以前的科学主要靠开放性的自然观察以及人类的理性思维为主,不是建立在比较可靠的实验数据的基础上。近代科学主要依靠实验室的受控实验以获取实验数据,并通过数据的归纳、推理以便得出比较可靠的科学规律。随着各种测量设备和技术的发明,人类对自然的测量和量化范围越来越宽,基本上实现了对自然界各种现象的测量和量化。现在的地球变成了数字地球,宇宙变成了数字宇宙,因此,自然界变成了一个完全被数据化的自然界。正因如此,自然科学和技术具备了普遍必然性,也获得了更加深入的理性认知,成为人文、社会科学各学科学习的榜样。

人类以及由人类构成的社会,具有主动性、自由性、非线性、涌现性等复杂性特征,其行为具有不确定性,因为我们不可能像对待自然界一样,通过受控实验,获取少量的数据就能够把握思想和行为规律,因此需要海量的数据才能刻画人类的复杂思想和行为。然而,在大数据之前,人们无法获取海量的数据,也无法存储、传输和处理这海量的数据。大数据技术的出现为人类及其社会的数据化提供了可行的技术和难得的机遇。大数据解决了人类及其社会的数据化问题,实现了量化人类及其社会的目标,我们进入了“量化人文”的阶段。由于智能技术的发展,人们有了智能手机、可穿戴设备、传感器、网络浏览记录以及摄像头等各种智能数据采集系统,因此各种数据能够源源不断地被自动采集,汇聚起来并快速地形成海量数据。这些数据全面记录和反映了人类思想、行为,通过数据挖掘,我们就能够找出人类思想、行为的历史轨迹,并根据历史轨迹能够预测其未来的思想和行为,因此依靠大数据,我们既可以精准描述人类的历史行为,又可以预测其未来的行为走向。像当年的望远镜和显微镜一样,大数据已经成为万能的“社会之镜”,通过它可以全方位地观察生活的各种复杂性。[8]12通过大数据,人类及其社会也像自然界一样,能够被全面数据化和计量化,实现人文社会科学的量化工作,并让人文社会科学成为真正的硬科学。

“大数据发展的核心动力来源于人类测量、记录和分析世界的渴望。”[7]104利用智能设备,我们的行为、位置,甚至身体生理数据等每一种变化都成了可被记录和分析的数据。以往只有完全数字化的数据才能够进行计算、处理等操作,而如今智能设备记录的数据本身就是数字化的。以前被认为无法数据化的文字、图片、视频、音频、个人感觉等信息,都可以通过信息转换,最终还原为由0和1构成的数字信息,将模拟信息自动转换为数字信息,从而实现海量信息的智能传输、存储、挖掘和利用。当文字、图片、音频、视频、方位等信息自动变成数据,人类的关系、经历、情感、意志、偏好、兴趣、情绪、习惯等以往认为极其个性化的信息自动变成数据之时,人类思想及其社会行为就有可能被彻底数据化。“大数据通过人与人之间的海量交换网络为我们提供了洞悉社会各种复杂性的机会。”[8]13通过智能芯片将万物联系起来的物联网将早已被初步数据化的自然世界更加彻底被数据化,加上早已实现了的个人与社会财富的数据化,以及如今的人类及其社会或人文的数据化,于是,世间万物真正彻底实现了数据化的目标。大数据成了人类洞察世界万物的“上帝之眼”[8]12,“只要一点想象,万千事物就能转化为数据形式”。[7]123

正如舍恩伯格所说:“大数据标志着人类在寻求量化和认识世界的道路上前进了一大步。过去不可计量、存储、分析和共享的很多东西都被数据化了。拥有大量的数据和更多不那么精确的数据为我们理解世界打开了一扇新的大门。”[7]23世界上几乎任何事物都可以用数据的方式量化,或者说“万物皆数据”。“量化一切”,成为大数据的终极目标,而且已经得到了初步的实现。“一旦世界被数据化,就只有你想不到,而没有信息做不到的事情了。”[7]125有了大数据的帮助,我们不会再将世界看

29

作是一连串我们认为或是自然或是社会现象的事件,我们将认识到世界是由数据构成的。[7]125

三数据实在:大数据的客观本质

自从大数据革命以来,数据被推到前所未有的历史高度。数据的本质究竟是什么?我们将从数据与信息、数据与物质、数据与客观知识之间的关系入手来回答这个问题。我们认为,数据是信息的一种表征方式,它是物质的根本属性之一,也是一种新型的客观实在,可以称之为“数据实在”。

(一)数据是信息的普适表征方式,数据的本质是信息

“‘数据’(data)这个词在拉丁文里是‘已知’的意思,也可以理解为‘事实’。”[7]104数据是我们主体对客体的描述,而且最终可以还原为最基本的二进制数字0和1,因此可以被计算机等智能设备所识别和处理。信息与数据到底是什么关系?一般认为,数据比信息更加基础,数据加上背景或语境就成为信息,在信息中找出规律就成为知识,因此数据、信息、知识三者之间形成一个金字塔结构。[9]但事实上,数据是数和据的结合,本身就带有背景或语境,因此数据与信息事实上具有等价关系。我们目前的大数据革命其实也就是信息革命的延续,或者说是信息革命的新阶段。

信息论之父香农在其原始文献《通信的数学理论》中,虽然没有定义信息的概念,但他把信息与描述混乱度的熵等同起来,并用熵增来作为信息的测度:H=-∑P i log2P i,这个测度公式其实是意外程度的量度,其中P i是可能讯息的出现概率。[5]222初看起来,香农似乎解决了信息的测度问题,但从技术层面来说,这个公式只适用于某些通信工程计算,没有普适性,因为我们一般情况下根本没法获得P i,所以也就没法计算信息量H。

但是,通过数据来测度信息却具有普适性,因为任何数据都是某种信息的反映,也就是信息的数据表征方式。在大数据时代,数据的挖掘和测度已经实现了智能化和自动化,因此通过数据来测度信息,是信息表征和测度的一种普适方法。

我们从维纳的论述中已经知道,构成自然世界最基本的要素有三种:物质、能量和信息。我们已论证了数据其实就是信息的一种表征,所以,数据是构成世界的三大客观要素之一,它是我们认识物质、计算能量的一种普适测度工具,也是构成世界的一种客观实在。

(二)数据是物质的一种根本属性,是物质与意识共同作用的结果

数据本体地位的提升让毕达哥拉斯当年的论断“万物皆数”,又产生了时代的回响。数据成为世界的本质,或者说数据成了世界的始基,这样是不是就否定了辩证唯物主义的物质第一性的论断呢?物质第一性是不是要变成数据第一性呢?这就涉及物质、意识与数据三者之间的关系。

仔细分析之后,我们会发现,无论是能量还是信息(数据),都需要物质作为载体才能存在。例如,无论是石油、煤炭还是太阳能,这些能量都寄居于物质载体之中。数据也是这样,任何数据都必须有其背景载体,都反映了物质及其关系的具体状态,或者说,数据是物质及其关系的反映,因此物质、能量与数据(信息)三者虽然都是客观存在,但能量和数据都是以物质作为载体基础。

从物质、意识与数据三者的关系来看,根据马克思主义哲学,意识是物质世界在人们头脑中的反映,它具有从属性,但数据该处于什么样的地位呢?从上述论述中,我们已经知道了数据作为信息,必须以物质为载体。数据从本质上来说应该是主体对物质客体世界的一种主观建构,是我们人类利用自己的主观能动的意识对客观物质及其关系的一种数量描述。就像康德所说,我们要认识和把握现象世界,就要用量、质、关系、模态等四大类十二个范畴才能对现象世界进行比较精致的刻画。[10]数据其实就是康德这四大类十二个范畴的综合描述和反映,即数据集中反映了物质现象的量、质、关系和模态等参数。“通过数据化,在很多情况下我们就能全面采集和计算有形物质和无形物质的存在,并对其进行处理。”[7]125数据虽然具有客观实在性,但是它依赖于物质,它是主体意识对客观物质的一种主观建构,因此数据对物质具有一种依随、主从关系。没有脱离物质及其关系的数据,数据都是物质及其关系的反映,当然任何物质以及关系都可以用数据来描述。数据是物质的一种根本属性,是物质与意识共同作用的结果。惠勒有点隐晦地说道:“我们所谓的实在(real-ity),是在对一系列‘是’或‘否’的追问综合分析后才在我们脑中成形的。所有实在之物,在起源上都是信息理论意义上的,而这个宇宙是个观察者参与其中的宇宙。”[5]7

(三)数据是一种属于波普尔世界3的客观实在

数据的实在性是一种怎样的实在性?柏拉图在

39

他那著名的洞喻中,囚徒在洞内墙上所看到的影子,是洞外实物在墙上的映射,虽然影子不是实物,但它们同样也具有某种实在性。当然这种实在性起初依赖于洞外的实物,而且如果这些影子没有被图画、记录下来,它们有可能消失,但一旦被记录下来,这些记录又成了另一种客观实在。数据就类似于囚徒墙上的影子,它依赖于物质实在,但它本身也成了一种新的实在。随着数据技术的发展,万事万物的所有状态都将留下数据足迹,这些数据足迹将永远被记录下来,成为一种数据实在。数据这种新实在,已经成为刻画万物特征的DNA,成了万物存在的新方式。

波普尔在其三个世界的划分中,将世界划分为三种,即物质世界(世界1)、精神世界(世界2)和客观知识世界(世界3)。[11]世界1指的是一切客观物质及其现象,例如物质、能量、一切有机物和无机物等等;世界2是指一切主观精神活动,他认为主观精神世界也是客观存在的。世界3是指客观知识世界,它是人类精神的产物,既包括抽象的精神产品,如思想观念、语言、文字、书画、哲学社会科学理论和自然科学理论等,也包括物化的人类精神产品,如技术装备、房屋建筑、计算机、汽车、飞机等。数据是客观物质与主观意识共同作用的产物,是人类对客观物质的主观描述,它属于精神产物,这种精神产品在某种尺度下也具有可重复性和客观性。因此,用波普尔三个世界的划分理论,数据应该属于世界3中的人类精神产品,归属于客观知识世界。

就像主观知识脱离主体之后就变成了客观知识一样,数据脱离采集者之后也变成了客观知识。大数据是海量规模的数据聚集在一起而形成的庞大数据集合。这些数据被智能终端自动采集或人类手工采集下来之后,就脱离了数据采集者而成为数据尘埃,并不断积淀为一个数据世界,成为一种人工化的客观存在,这种存在我们可称之为数据实在。由大数据形成了数据实在,这种新实在引起了客观世界构成成分的变化,更增加了世界3的新内容。数据实在的形成带来了需要哲学研究的许多新问题,给哲学本体论研究带来了新课题。

【参考文献】

[1]FLORIDI L.Big data and their epistemological challenge [J].Philo.Technol,2012(25):435-437.

[2]KITCHINR.Big data,new epistemologies and paradigm shifts[J].Big data&society,April-June,2014:1-12.[3]罗素.西方哲学史:上卷[M].何兆武,李约瑟,译.北京:商务印书馆,1963:62.

[4]老子.道德经[M].第四十二章.

[5]格雷克.信息简史[M].高博,译.北京:人民邮电出版社,2013.

[6]诺伯特维纳.控制论[M].郝季仁,译.北京:科学出版社,1962:133.

[7]恩伯格,肯尼思库克耶.大数据时代[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013.

[8]彭特兰.智慧社会:大数据与物理学[M].汪小帆,汪蓉,译.杭州:浙江人民出版社,2015.

[9]涂子沛.大数据:正在到来的数据革命[M].桂林:广西师范大学出版社,2013:88.

[10]康德.纯粹理性批判[M].邓晓芒,译.北京:人民出版社,2004:71-72.

[11]波普尔.客观知识[M].舒炜光,等译.上海:上海译文出版社,1987:164-165.

The Ontological Assumption and Objective Nature of Big Data

HUANG Xin-rong

(Management PhilosophyResearch Center,Jiangxi University of Finance and Economics,Nanchang330013,China)

Abstract:With the rise of big data,the essence of data has changed greatly.In big data era all is thought to be number,that is to say,all things in the world can ultimately be reduced to data,thus data is the world;all things can be expressed by data,and“To quantify everything”is the ultimate goal of the big data era;data is the suitable characterization of information and new form of reality;it is the mapping of the physical world,with Karl Popper’s world3of objective reality.Big data makes the world quantified,and data mining allows us to fully recognize the world of data,thus the world will become a transparent one.

Key words:big data;ontology;the essence of data;data reality;transparent world

(责任编辑许玉俊)49

大数据考试答案72784

? 1.规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指的是()。(单选题1分) o A.富数据 o B.贫数据 o C.繁数据 o D.大数据 ? 2.世界上第一台电子计算机(ENIAC)是在哪一年宣告诞生的?(单选题1分)得分:1分 o A.1946年 o B.1949年 o C.1948年 o D.1947年 ? 3.“最为成功的商业运作模式是价格最低的资源将会被尽可能的消耗,以此来保存最昂贵的资源”,这是下列哪个定律的内涵?(单选题1分)得分:1分o A.麦特卡尔夫定律 o B.摩尔定律 o C.吉尔德定律 o D.牛顿定律 ? 4.第一个提出大数据概念的公司是()。(单选题1分)得分:1分

o A.麦肯锡公司 o B.谷歌公司 o C.脸谱公司 o D.微软公司 ? 5.()年3月1日,贵州·北京大数据产业发展推介会在北京隆重举行,贵州大数据正式启航。(单选题1分)得分:1分 o A.2012 o B.2014 o C.2010 o D.2016 ? 6.大数据要求企业设置的岗位是(单选题1分)得分:1分 o A.首席信息官和首席数据官 o B.首席分析师和首席数据官 o C.首席分析师和首席工程师 o D.首席信息官和首席工程师 ?7.()指利用计算机处理信息的技术,是现代信息技术的核心。(单选题1分)得分:1分 o A.计算机技术 o B.感测技术 o C.通信技术

o D.微电子技术 ?8.2015年,贵阳市的呼叫服务产业达到()坐席。(单选题1分)得分:1分o A.20万 o B.10万 o C.5万 o D.3万 ?9.《国务院办公厅关于促进农村电子商务加快发展的指导意见》要求:到()年,初步建成统一开放、竞争有序、诚信守法、安全可靠、绿色环保的农村电子商务市场体系。(单选题1分)得分:1分 o A.2030年 o B.2035年 o C.2025年 o D.2020年 ?10.医疗健康数据的基本情况不包括以下哪项?(单选题1分)得分:1分o A.个人健康管理数据 o B.健康档案数据 o C.诊疗数据 o D.公共安全数据 ?11.关于大数据在社会综合治理中的作用,以下理解不正确的是()。(单选题1分)得分:0分

2017大数据培训考试题(卷)目与答案解析(98分)

? 1.大数据的本质是(单选题1分)得分:1分 ? A.联系 ? B.搜集 ? C.挖掘 ? D.洞察 ? 2.大数据要求企业设置的岗位是(单选题1分)得分:1分 ? A.首席分析师和首席工程师 ? B.首席信息官和首席工程师 ? C.首席分析师和首席数据官 ? D.首席信息官和首席数据官 ? 3.根据周琦老师所讲,高德交通信息服务覆盖全国高速()以上。(单选题1分)得分:1分? A.90% ? B.70% ? C.60% ? D.50% ? 4.()提出在今后的十几年里,半导体处理器的性能,比如容量、计算速度和复杂程度,每18个月左右可以翻一番。(单选题1分)得分:1分 ? A.比尔?盖茨 ? B.戈登?摩尔 ? C.乔布斯 ? D.爱因斯坦 ? 5.活字印刷术是由()发明的。(单选题1分)得分:1分

? B.毕昇 ? C.商鞅 ? D.鲁班 ? 6.以下说法错误的是哪项?(单选题1分)得分:1分 ? A.大数据是一种思维方式 ? B.大数据不仅仅是讲数据的体量大 ? C.大数据会带来机器智能 ? D.大数据的英文名称是large data ?7.根据涂子沛先生所讲,以下说法错误的是哪项?(单选题1分)得分:1分 ? A.计算就是物理计算 ? B.数据的涵发生了改变 ? C.计算的涵发生了改变 ? D.搜索就是计算 ?8.促进大数据发展部级联席会议在哪一年的4月13日召开了第一次会议?(单选题1分)得分:1分 ? A.2013年 ? B.2014年 ? C.2015年 ? D.2016年 ?9.通过精确的3D打印技术,可以使航天器中()的导管一次成型,直接对接。(单选题1分)得分:1分

大数据复习题(答案)

一、单选题 1、大数据的起源是(B)。 A:金融B:互联网C:电信D:公共管理 2、大数据的最明显特点是(B)。 A:数据类型多样B:数据规模大C:数据价值密度高D:数据处理速度快 3、大数据时代,数据使用的最关键是(D)。 A:数据收集B:数据存储C:数据分析D:数据再利用 4、云计算分层架构不包括(D)。 A: Iaas B: Paas C: Saas D: Yaas 5、大数据技术是由(C)公司首先提出来的。 A:阿里巴巴B:百度C:谷歌D:微软 6、数据的精细化程度是指(C),越细化的数据,价值越高。 A:规模B:活性C:颗粒度D:关联性 7、数据清洗的方法不包括(C) A:噪声数据清除B:一致性检查C:重复数据记录处理D:缺失值处理 智能手环的应用开发,体现了(C)的数据采集技术的应用。A:网络爬虫B:API接口C:传感器D:统计报表 9、下列关于数掲重组的说法中,错误的是(A)。 A:数据的重新生产和采集B:能使数据焕发新的光芒C:关键在于多源数据的融合和集成 D:有利于新的数据模式创新

10、美国海军军官莫里通过对前人航海日志的分析,绘制考了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的(B)。 A:在数据基础上倾向于全体数据而不是抽样数据 B:在分析方法上更注重相关分析而不是因果分析 C:在分析效果上更追究效率而不是绝对精确 D:在数据规模上强调相对数据而不是绝对数据 11、下列关于含思伯格对大数据特点的说法中,错误的是(D) A:数据规模大B:数据类型多 C:处理速度快D:价值密度高 12、当前社会中,最为突出的大数据环境是(A)A:互联网B:自然环境C:综合国力D:物联网 13、在数据生命周期管理实践中,(B)是执行方法。 A:数据存储和各份规范B:数据管理和维护C:数据价值发觉和利用D:数据应用开发和管理 14、下列关于网络用户行为的说法中,错误的是(C)。 A:网络公司能够捕捉到用户在其网站上的所有行为 B:用户离散的交互痕迹能够为企业提升服务质量提供参 C:数字轨迹用完即自动删除 D:用户的隐私安全很难得以规范保护 15、下列关于聚类挖报技术的说法中,错误的是(B)。 A:不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别 B:要求同类数据的内容相似度尽可能小 C:要求不同类数据的内容相仪度尽可能小

大数据的本质解析

本文来自:5联网https://www.wendangku.net/doc/b3791513.html,/ 如果仅仅是海量的结构性数据,那么解决的办法就比较的单一,用户通过购买更多的存储设备,提高存储设备的效率等解决此类问题。然而,当人们发现数据库中的数据可以分为三种类型:结构性数据、非结构性数据以及半结构性数据等复杂情况时,问题似乎就没有那么简单了。 大数据汹涌来袭 当类型复杂的数据汹涌袭来,那么对于用户IT系统的冲击又会是另外一种处理方式。很多业内专家和第三方调查机构通过一些市场调查数据发现,大数据时代即将到来。有调查发现,这些复杂数据中有85%的数据属于广泛存在于社交网络、物联网、电子商务等之中的非结构化数据。这些非结构化数据的产生往往伴随着社交网络、移动计算和传感器等新的渠道和技术的不断涌现和应用。 如今大数据的概念也存在着很多的炒作和大量的不确定性。为此,编者详细向一些业内专家详细了解有关方面的问题,请他们谈一谈,大数据是什么和不是什么,以及如何应对大数据等问题,将系列文章的形式与网友见面。 有人将多TB数据集也称作"大数据"。据市场研究公司统计,数据使用预计将增长44倍,全球数据使用量将达到大约35.2ZB(1ZB = 10亿TB)。然而,单个数据集的文件尺寸也将增加,导致对更大处理能力的需求以便分析和理解这些数据集。

1000多个客户在其阵列中使用1PB(千兆兆)以上的数据数据,这个数字到2020年将增长到10万。一些客户在一两年内还将开始使用数千倍多的数据,1EB(1艾字节= 10亿GB)或者更多的数据。 对大企业而言,大数据的兴起部分是因为计算能力可用更低的成本获得,且各类系统如今已能够执行多任务处理。其次,内存的成本也在直线下降,企业可以在内存中处理比以往更多的数据,另外是把计算机聚合成服务器集群越来越简单。这三大因素的结合便催生了大数据。同时,某项技术要想成为大数据技术,首先必须是成本可承受的,其次是必须满足IBM 所描述的三个"V"判据中的两个:多样性(variety)、体量(volume)和速度(velocity)。 多样性是指,数据应包含结构化的和非结构化的数据。 体量是指聚合在一起供分析的数据量必须是非常庞大的。 而速度则是指数据处理的速度必须很快。 大数据"并非总是说有数百个TB才算得上。根据实际使用情况,有时候数百个GB的数据也可称为大数据,这主要要看它的第三个维度,也就是速度或者时间维度。 全球信息量正在以59%以上的年增长率增长,而量是在管理数据、业务方面的显著挑战,IT领袖必须侧重在信息量、种类和速度上。 量:企业系统内部的数据量的增加是由交易量、其它传统数据类型和新的数据类型引发的。过多的量是一个存储的问题,但过多的数据也是一个大量分析的问题。 种类:IT领袖在将大量的交易信息转化为决策上一直存在困扰- 现在有更多类型的信息需要分析- 主要来自社交媒体和移动(情景感知)。种类包括表格数据(数据库)、分层数据、文件、电子邮件、计量数据、视频、静态图像、音频、股票行情数据、金融交易和其它更多种类。

从哲学角度看问题 数据 大数据及其本质是什么

从哲学角度看问题数据大数据及其本质是什么 最近几年,数据问题进入哲学视野。对于哲学家们探索的数据本质特征,我们可以从以下几个方面来把握。 数据与大数据 技术进步,主要是计算机、网络和各种类型的传感器以及云技术、分布式计算与存储等海量存储技术的广泛应用和运算能力极速进步,使得数据概念被大数据概念取代。数据量增加速度之快,大致可以这样描述:最近两年生成的数据量,相当于此前一切时代人类所生产的数据量的总和。 大数据指的是所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。大数据的特征,除了巨大、快速、多样多变之外,没有其他。因此,大数据本质上还是数据。 在大数据的上述特征中,其多样多变性值得特别关注。它表现为所生成数据格式的多样,如文字、图片、视频等各有多种不同的格式,取决于生成数据的技术与设备,却反映出数据生产的时代性以及数据处理的能力与条件,也反映出被描摹自然和社会的多姿多彩。另外,随着技术发展和数据量急剧增长,新的数据格式还会层出不穷,多变和多样特征更加突出。 大数据既是一个技术概念,又是一个商业概念,它的出现,有其特定背景,即it领域的商业和渲染新技术的考量。大数据包揽了人类获取数据的所有途径,提示哲学研究一个全新时代的到来,这个时代的先声,很久远之前就已经响起,那时,它仅仅被称作数据。在我们的讨论中,主要考虑数据与哲学的关联。 数据与认识 这里的认识,指的是人的认识,是人对外部世界的认识。 大数据的出现和引起关注,使得一个事实得到确认,这就是,数据覆盖了人类对于外部世界的感知。感官及其所获得的经验退居到显示屏之后,退居到各种类型的技术装置之后,这些装置将自然和外部世界的映像“转译”成人类感官可以接受的图像、声音甚至触觉和嗅觉味觉。这既是技术发展的必然,又是始料未及的情况。如果说,此前,哲学还试图在技术系统生成的数据之外寻找世界的直观映像,到了大数据时代,这种人类的直接感知即使没有被完全取代,也失去了其传统意义上的优势。一言以蔽之,哲学,需要从数据中寻求对世界的认识,舍此即失去认识的来源。 这似乎是一个惊人的变故,其实不然。在影响人类认识的议题上,大数据带来的变化,只是数量和范围上的,并非根本意义上的改变。事实上,回顾历史,我们发现,我们的对外部世界的感知,从来都是依赖于某些技术装置的,也就是说,人的认识,其实是通过数据获得的。 最早的技术装置,可能是直尺,它用于测量长度,例如田亩;更早的述说技术装备,也许是绳结,它用来述说一件重要的事件。在我国,从河北泥河湾先民打造石器,到安阳殷墟龟甲上刻画的文字,都可以看作是某种“数据”,表达着人类对外部世界的某种认知。而面对着所有这些早期的承载数据的技术装备,人们获得对外部世界的某种最早的抽象认识。古代人先后发明过算筹、斗和称、漏刻、浑象仪、量角器等等,无不是用来产生认知外部世界的数据,人们也发明笔、纸张、雕版印刷术,也是用来记录和生产数据。依托所有这些,数据成为人们认识的依据,思考的源泉,表达的工具。 近代以来,西方的技术和科学异军突起,望远镜、显微镜、六分仪、光谱仪、质谱仪乃至加速器、射电望远镜相继出现,成为人类认识外部世界的有力工具。这些技术装备产生的数据成为近现代思想的新的依托。到了当代,伴随着电子计算机的强大数据处理能力的出现,各种延伸和阔展人类感官感知能力的器皿设备层出不穷,终于完全或接近于完全取代人类对

辨析数仓、大数据、数据中台的实质(内附21张架构图)

辨析数仓、大数据、数据中台的实质本人断断续续从事数据仓库约有五六年经验,在移动公司前三年是负责数据仓库项目实施,后四年开发搞大数据平台,见证了从传统数据仓库转型到大数据平台的全历程,见证了大数据平台从0到1的全部过程,包括第一个MPP 数据集市、第一个Hadoop集群项目、第一个流式数据处理项目,第一个完整的大数据平台的融合和构建,混搭式大数据平台的融合构建,大数据平台的迁移等等,我所经历的大数据平台从规模说大不大说小不小,每天处理数据量将近20T(实时处理月10T左右),总集群约300台(其中Hadoop节点约200台),总容量约8P,实际使用容量约5P;包括了从数据仓库到大数据平台数据模型的重构,数据模型的拓展;也包括了大数据平台提供各种对内应用的规划,和向外提供大数据应用。因此对数据仓库和大数据平台的优缺点、各自存在的问题、疑惑、发展方向,也算有一定的认知,包括对新生的数据中台的发展方向,结合自己过往的经验,谈谈自己的一些想法。 1什么是数据中台? 说实在的,互联网是制造新名词的地方,现在各种新名词层出不穷,顶层的有数字城市、智慧地球、智慧城市、城市大脑;企业层面的有数字化转型、互联网经济,数字经济、数字平台;平台层面的有物联网,云计算,大数据,5G,人工智能,机器智能,深度学习,知识图谱;技术层面的有数据仓库、数据集市、大数据平台、数据湖、数据中台、业务中台、技术中台等等,总之是你方唱罢他登场,各种概念满天飞…在比拼新经济的过程中,其实比拼的是流量也就是用户,但流量不等于用户,用户也不完全等同于流量;有了流量和用户,就等于比拼了对用户的话语权。各种互联网概念也是如此,单纯从传统的

大数据的基本特性

对大数据的基本特征有很多看法,但学术界普遍认可的是“3V”或“4V”的说法。3V特性是指容量巨大(V olume)、品种复杂(Velocity)、处理速度快,4V在此基础之上增加了价值密度低(Value)。随着数据挖掘技术和数据处理技术的发展,大数据的价值开始体现出来。 (1)容量巨大。十年前,我们对数据容量认知单位仅限于MB 和GB,但现在业务中使用的最基本的数据容量单位已达到TB。百度、腾讯、阿里等网络公司已经达到ZB(1ZB=1万亿GB)。目前,全球数据量仍在增长,年增长率超过40%。 (2)种类复杂。我们通常所说的数据是一个整体性的概念,按照不同的划分方式,数据可以被划分为多种类型,最常用和最基本的就是利用数据关系进行划分,有结构化数据、半结构化数据和非结构化数据,在小数据时代基本以结构化数据为主,随着数据技术的不断发展才出现了半结构化和非结构化数据。另外,从数据来源上划分,有社交媒体数据、传感器数据和系统数据。从数据格式上划分,有文本数据、图片数据、音频数据、视频数据等。近几年数据的种类增加

了很多,主要原因是移动设备、传感器以及通讯手段的增加,如此复杂多变的数据种类,带来的将是数据分析和数据处理的困难,势必会引发相应技术的变革。 (3)处理速度快。数据的数量和类型都在不断增加,直接影响到的就是数据的处理速度。大数据时代的基本要求就是速度要快,在数据资源化的趋势下,当今时代数据已然成为一种资源,但数据同现实中的物质资源不同,物质资源是不会消失和失去自身价值的,由于数据自身具有时效性,其所能挖掘的价值可能稍纵即逝,如果大量的数据来不及处理,就会变成数据垃圾。所以,现在的网络市场,各大互联网公司进行的不仅仅是数据的竞争,同时还是速度的竞争,要想在市场中占据主动地位,就必须要对拥有的数据进行快速的、实时的处理。 (4)价值密度低。价值性是大数据最本质的特性之一,大数据之所以能够得到各行各业的重视,主要原因就是其背后巨大的潜在价值,但是它的价值密度却很低。价值密度我们可以理解成有用数据在总数据中所占的比例。价值密度低的原因一方面是因为庞大的数据量和复杂的数据类型,基数过大带来的不仅是有价值的数据,更多的是垃圾数据和无用数据;另一方面是因为处理速度过慢,无法迅速准确的获取有价值的数据。纵使价值密度低,也无法阻挡人们对大数据的狂热,其根源还是在于数据背后所隐藏的巨大价值,大数据预测,将是大数据发展的主要方向。 以上就是全部内容,希望对大家有所帮助,感谢您的阅读!

解析大数据思维的五大商业本质课后测试答案

课后测试 测试成绩:80.0分。恭喜您顺利通过考试! 单选题 ?1、下列关于个性化思维的说法正确的是?(10 分) A 一切皆可量化 B 以消费者为中心 C 一切皆可尝试 D 一切皆有联系 正确答案:B ?2、下列关于“探索未知的思维变革”的说法错误的是?(10 分) A 从追求因果关系到追求相关关系 B 从追求算法到追求数据 C 大数据的复杂计算和小数据的简单计算 D 大数据的简单计算和小数据的复杂计算 正确答案:C 多选题 ?1、下列哪些属于实体商家的经营难题?(10 分) A 客流量少 B 宣传成本高 C 回头客少 D 成交率低 正确答案:A B C D

?2、门店流量持续下降的现状是什么?(10 分) A 实体经营趋于稳定 B 人流量持续上升 C 人口增长红利衰减 D 用户增长逐渐放缓 正确答案:A C D ?3、下列关于“管理决策的思维变革”说法正确的是?(10 分) A 从事后总结到事前规划 B 从定性描述到定量分析 C 从拍脑袋到用数据说话 D 从抽样调研到全体数据分析 正确答案:A B C D ?4、在大数据的世界里,我们需要知道客户的哪些最基本的信息?(10 分) A 消费习惯 B 用户喜好 C 用户需求 D 消费能力 正确答案:A B C D ?5、大数据在哪些阶段内会成为第四范式?(10 分) A 经济科学阶段 B 理论科学阶段 C

计算科学阶段 D 数据密集型阶段 正确答案:A B C D 判断题 ?1、大数据的世界不只是一个单一的巨大的计算机网络,而是一个由大量活动构件以及多元参与者元素所构成的一个生态系统。(10 分) A 正确 B 错误 正确答案:正确 ?2、大数据下新零售门店的变革目的是吸粉和留存。(10 分) A 正确 B 错误 正确答案:正确 ?3、流量的垄断性导致美团、携程、去哪儿等都变成了流量压榨平台和广告媒体。(10分) A 正确 B 错误 正确答案:正确

农信 网络学院 解析大数据思维的五大商业本质 课后 测试 答案

解析大数据思维的五大商业本质 课后测试 单选题 1、下列关于个性化思维的说法正确的是?(10 分) A 一切皆可量化 ? B 以消费者为中心 C 一切皆可尝试 D 一切皆有联系 正确答案:B 2、下列关于“探索未知的思维变革”的说法错误的是?(10 分) A 从追求因果关系到追求相关关系 B 从追求算法到追求数据 ? C 大数据的复杂计算和小数据的简单计算 D 大数据的简单计算和小数据的复杂计算 正确答案:C

多选题 1、下列哪些属于实体商家的经营难题?(10 分) A 客流量少 B 宣传成本高 C 回头客少 D 成交率低 正确答案:A B C D 2、门店流量持续下降的现状是什么?(10 分) A 实体经营趋于稳定 B 人流量持续上升 C 人口增长红利衰减 D 用户增长逐渐放缓 正确答案:A C D

3、下列关于“管理决策的思维变革”说法正确的是?(10 分) A 从事后总结到事前规划 B 从定性描述到定量分析 C 从拍脑袋到用数据说话 D 从抽样调研到全体数据分析 正确答案:A B C D 4、在大数据的世界里,我们需要知道客户的哪些最基本的信息?(10 分) A 消费习惯 B 用户喜好 C 用户需求 D 消费能力 正确答案:A B C D 5、大数据在哪些阶段内会成为第四范式?(10 分)

A 经济科学阶段 B 理论科学阶段 C 计算科学阶段 D 数据密集型阶段 正确答案:A B C D 判断题 1、大数据的世界不只是一个单一的巨大的计算机网络,而是一个由大量活动构件以及多元参与者元素所构成的一个生态系统。(10 分) ? A 正确 B 错误 正确答案:正确 2、大数据下新零售门店的变革目的是吸粉和留存。(10 分) ? A 正确 B 错误

大数据培训考试94分

? 1.大数据要求企业设置的岗位是(单选题1分)得分:1分 o A.首席分析师和首席工程师 o B.首席信息官和首席工程师 o C.首席分析师和首席数据官 o D.首席信息官和首席数据官 ? 2.吴军博士认为未来二十年就是()为王的时代。(单选题1分)得分:1分o A.农业 o B.文化 o C.数据 o D.工业 ? 3.根据涂子沛先生所讲,以下说法错误的是哪项?(单选题1分)得分:1分o A.计算就是物理计算 o B.数据的内涵发生了改变 o C.计算的内涵发生了改变 o D.搜索就是计算 ? 4.2014年,阿里平台完成农产品销售()元。(单选题1分)得分:1分o A.183亿 o B.283亿 o C.383亿 o D.483亿

? 5.第一个提出大数据概念的公司是()。(单选题1分)得分:1分o A.微软公司 o B.脸谱公司 o C.谷歌公司 o D.麦肯锡公司 ? 6.大数据的利用过程是()。(单选题1分)得分:1分 o A.采集——清洗——统计——挖掘 o B.采集——清洗——挖掘——统计 o C.采集——统计——清洗——挖掘 o D.采集——挖掘——清洗——统计 ?7.根据周琦老师所讲,大数据加速道路网络快速更新,高德()完成全国10万公里15万处更新。(单选题1分)得分:1分 o A.2006年 o B.2008年 o C.2010年 o D.2014年 ?8.根据周琦老师所讲,高德实时统计用户近()行驶里程数据与用户数,一旦发现异常则报警。(单选题1分)得分:1分 o A.5分钟 o B.10分钟 o C.15分钟 o D.20分钟

大数据思考与练习,答案(2)

大数据思考与练习 一、单选题 1.当前大数据技术的基础是由(C )首先提出的。 A.微软 B.百度 C.谷歌 D.阿里巴巴 2.大数据的起源是(D )。 A.金融 B.电信 C.互联网 D.公共管理 3.智能健康手环的应用开发,体现了( D )的数据采集技术的应用。 A.统计报表 B.网络爬虫 C.API接口 D.传感器 4.2012年,(B )政府发布了《大数据研究和发展倡议》,标志着大数据已经成为重要的时代特征。 A.中国 B.美国 C.日本 D.英国 5.大数据的最显著特征是(A )。 A.数据规模大 B.数据类型多样 C.数据处理速度快 D.数据价值密度高 6.下列关于大数据特点的说法中,错误的是(D )。 A.数据规模大 B.数据类型多样 C.数据处理速度快 D.数据价值密度高 7.当前社会中,最为突出的大数据环境是(A)。 A.互联网 B.物联网 C.综合国力 D.自然资源 8.医疗健康数据的基本情况不包括以下哪项?(D ) A.诊疗数据 B.个人健康管理数据 C.健康档案数据 D.公共安全数据 8.下列关于计算机存储容量单位的说法中,错误的是(C )。 A.1KB<1MB<1GB B.基本单位是字节(Byte) C.一个汉字需要一个字节的存储空间 D.一个字节能够容纳一个英文字符 9.在数据生命周期管理实践中,( B )是执行方法。 A.数据存储和备份规范 B.数据管理和维护 C.数据价值发觉和利用 D.数据应用开发和管理 10.大数据时代,数据使用的关键是(D )。 A.数据收集 B.数据存储 C.数据分析 D.数据再利用 11.大数据的本质是( C ) A.联系 B.挖掘 C.洞察 D.搜集 12.规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指的是( A )。 A.大数据 B.贫数据 C.富数据 D.繁数据 13.信息技术的发展非常快,表现在(A )。 A.集成电路的规模每18到24个月翻一倍 B.信息的存储能力每9个月翻一番 C.信息的存储能力每9个月翻一番 D.光通讯的速率和容量每年翻一番 14.与大数据密切相关的技术是(B )。 A.蓝牙 B.云计算 C.博弈论 D.WiFi 15.大数据应用需依托的新技术有(D )。 A.大规模存储与计算 B.数据分析处理 C.智能化 D.三个选项都是 16.数据科学就是从( C )中提取知识的研究。 A.流量 B.互联网 C.数据 D.人群 17.IBM在3V的基础上又归纳总结了第4个V是指(A )。 A.真实和准确 B.无时不在 C.巨量 D.极速 18.IDC的定义除了揭示大数据传统3V基本特征,即Volume、Variety和Velocity,还

大数据的概念

对于大数据的概念,麦肯锡认为“大数据是一种数据聚合,其数据容量超过了传统数据技术获取、存储、处理和应用的能力”。这个定义的主观性很强。它只定义了一个多大的数据集才能被称为是大数据。也许现在我们可以将容量超过TB的数据集称为大数据。但随着技术的发展,大数据的标准也将发生变化,只会越来越大。 维基百科:“表面上,大数据指的是大量的数据收集。实际上,从技术角度来看,它是指使用常用的硬件和软件工具获取和分析数据所需的时间超过可接受时间的数据集,“这是一个非常容错的定义,既不限制常用软件的范围,也不提出容错时间的标准。 EMC对大数据的定义是:“大数据可以看作是一个描述性的术语,它可以用来描述结构复杂且呈指数增长的数据集。这种数据集不能被关系数据库分析和处理。它代表了各种数据(其中大多数是非结构化的)的永无止境的累积。因此,无论是TB 数量级还是PB 数量级,即使数据的准确量更多,也不如最终的数据使用结果重要。EMC强调数据的价值,也就是说,大数据的本质不在于数据的巨大,而在于数据背后隐藏的价值。

许多机构和学者对大数据进行了定义。大数据的定义主要从两个方面出发:一方面是技术,主要从大数据的采集、存储和应用过程进行分析,如麦肯锡;另一方面是价值。主要从大数据的潜在价值和被挖掘的可能性进行分析,如像EMC。大数据技术是指利用非常规软、硬件工具对大量复杂数据进行处理,以获得分析预测结果的数据处理技术。大数据通常包括数据采集、存储、分析和应用等相关技术。 从技术哲学的角度看,大数据不仅具有技术的自然属性和社会属性,而且还具有价值。自然界的三个要素是物质、能量和信息,数据本身属于一种信息,它是人们在计算机网络和各种电子终端上留下的印记。数据本身是客观存在,具有自然属性。大数据的出现是时代的产物,是社会自动化发展的结果,大数据的发展受到政治、经济、文化等诸多社会因素的制约,具有社会属性。同时,大数据导致的数据安全和隐私泄露问题也引起了广泛关注,大数据本身就承载着价值。 以上就是全部内容,希望对大家有所帮助,感谢您的阅读!

相关文档
相关文档 最新文档