文档库 最新最全的文档下载
当前位置:文档库 › 大数据生活方式与社会治理

大数据生活方式与社会治理

大数据生活方式与社会治理
大数据生活方式与社会治理

大数据生活方式与社会治理

课程前言

田桐:学术前沿,思想对话,欢迎走进《世纪大讲堂》。如果有一天你看到一辆无人驾驶的车辆行驶在公路上,或者有一天看到一台打印机能够完完全全打印出你想所要的所有东西的话,那么你不必讶异,因为您已经进入到了大数据的时代。正如哈佛大学社会学的教授加里·金所指出的,这是一场革命,庞大的数据资源已经使得各个领域开始进入到了信息化的时代。无论是商界、学术界还是政府,所有领域都将进入到这个进程。那么究竟什么是大数据,大数据时代对我们的生活带来哪些变革和挑战呢?我们今天请到的嘉宾是《大数据》一书的作者,著名的信息管理专家涂子沛先生和我们阐述《大数据生活方式与社会治理》,有请。

解说:涂子沛,知名信息管理专家,中国旅美科学技术协会副主席,兼任华南理工大学公共政策研究院副教授,广东省政府大数据顾问。2012年其著作《大数据》在中国引起了对大数据战略的讨论,被《亚洲周刊》等媒体评为“2012年度中国十大好书”。2013年10月因为在大数据领域的研究和贡献,获第四届中国软科学前沿探索奖。

田桐:涂老师您好,非常感谢您的远道而来。

涂子沛:您好田桐,您好,大家好。

田桐:那么其实大数据这样一个词,我们进入到我们的视线当中是从2012年开始的,究竟大数据是一个什么样的概念?它起源于什么时候?

涂子沛:对,我们大家现在都在谈大数据,2012年被称为大数据元年,我们说怎么来理解这个大数据这个概念呢?核心要理解什么叫大,田桐你怎么理解什么是大呢?

田桐:所谓这个大数据我不知道是它的容量大还是说它现在所需要,或者今后承载的东西会越来越大?就是这个大是一个质的数字还是说一个量的数字?

涂子沛:没错。

田桐:我不太了解这个。

涂子沛:你说到的,我们说最重要的就是容量在变大,但是容量在变大呢是一个现象,我们说大,还是可以说大房子还有大人物大趋势,这个大的意思是表示重要性、价值。那我们说本质是什么,大数据的本质是数据的价值在增加,除了容量在变大。

田桐:我们看到您的这本书,也是非常火的一本书《大数据》,在它的这个封面的副标题上也写着正在到来的数据革命。您认为这个革命是什么样的革命?会不会是第四次的浪潮?

涂子沛:我们经常说第四次的浪潮是针对说我们有前三次技术的浪潮对吧,18世纪的蒸汽机的浪潮,19世纪内燃机的浪潮到20世纪计算机的浪潮,这股浪潮呢说把我们带进了信息社会、信息时代。我们现在大数据时代来到了,我们说是一个新的浪潮,但是呢我们能不能说这是人类历史上的第四次浪潮?这个结论我们暂时还不能下,我们要拉长历史的镜头,还有待观望,但是大部分学者都认为,我们已经不仅仅处在一个信息时代了。很多人说在我们在一个新的时代,那这个新的时代叫什么名字呢?有的人说叫新信息时代,有人说叫后信息时代,那我有个观点,我认为我们在进入一个智能时代,不是一个简单的信息时代。

田桐:那么所谓的大数据时代,眼看着就要到来了,可能已经到来了,它对于我们来说难道仅仅只是数字上的改变吗?它会对我们的生活起到什么样的变化?

涂子沛:对,数据会影响我们的生活,最大的影响是什么呢?是我们会越来越依赖机器,越来越依赖网络,机器跟网络呢会获得智能,获得智慧,我们会进入一个人机共生的状态。但机器呢又是由数据驱动的,我们的生活会被数据主导,被数据驱动。有一句话说软件在定义这个世界,数据在驱动这个世界。

田桐:那您觉得这是一个好的事情还是一个坏的事情,生活的所有重点全部都由数据来驱导?

涂子沛:我认为这不是一个糟糕的事情,毕竟我们在迈进一个智能化的时代,这个智能化的时代,我们享受到很多的便利,就像主持人刚刚说的,无论驾驶汽车、3D打印,这都是在数据背后在驱动。我们生活身边就已经有很多了,你像阿里巴巴,这是我们中国的大数据公司,它在短时间内能够发放贷款,原来我们发放一笔贷款那经常要几个星期甚至一个月的时间去审核,但是它依靠它的大数据,在几分钟之内就能做出我贷不贷款这个决定效率是大大提高了。

田桐:那么现在在国际上都有哪些国家是在大数据引领前方的?

涂子沛:我想科技的引领者那肯定首推应该是美国了对吧,欧洲跟美国它们在这方面都做的不错。

田桐:他们比我们领先在哪些方面?

涂子沛:首先我想的话,就数据而言,我们现在说大数据时代数据是金矿,首先你得有这个矿,他们进入信息时代,进入信息社会比我们早,他们数据的积累比我们多,这是第一。

第二,所有的基本上新的理念,技术浪潮的数据挖掘,机器学习这些新的理念还是在西方国家首先提出来。大部分高级的、高端的数据的分析工具,自主知识产权也在美国也在欧洲,那么还在说他们为了推动这个时代,欧洲很多国家包括美国,全世界有四十多个国家都在开放数据。我们数据现在是最重要的资源,他们把那些最重要的资源当中核心的部分、基础的部分、公共的部分拿出来开放,免费给全世界使用,这推动了科技创新跟社会创新。

田桐:那现在中国发展到一个什么样的地步了?我们接下来往哪方面发展?

涂子沛:我想的话,我们中国在大数据浪潮这个浪潮,我们是挑战跟机遇并存,这个浪潮是我们离世界的距离最近的一次,我们相对以前的浪潮,我们刚刚谈了三次技术浪潮,那时候我们跟世界的差距很大,但是现在我们跟世界的差距已经越来越小了,已经越来越小了。我们虽然还不是一些新的思想、新的技术产生的地方,但是新的思想、新的理念在全球自由的流动,我们可以吸收得很好,我们可以传播得很好。我们可以学习的很好,所以这是我们的机遇。

田桐:非常感谢您,更多的内容马上由您给我们带来今天的演讲,有请。

解说:大数据无疑是当下最为火热的IT词汇,围绕大数据价值的利用,逐渐成为各行业人士争相追捧的焦点。到底什么是大数据?它是如何发展而来?什么是数据挖掘?《世纪大讲堂》《大数据生活方式与社会治理》正在播出。

一、大数据的概念

涂子沛:大家好,我们今天在这里是学术前沿、思想交流,我们说我们谈到大数据的时候,现在是一个很热的话题,怎么来认识大数据的现象?万事万物都有一个起点,我们的起点是什么?我们的起点是数据。什么是数据?我们要了解什么是大数据,首先要明白什么是数据,数据不是简单的数字,数据是有根据的数字,数据是对客观世界的一个测量,一个记录,这才是数据。当我们一想到数据,我们会想到什么?我们会想到计算,我们想到事实,数据是最尖锐的事实,最精确的事实。为什么要用数据说话?翻译过来就是要用事实来说话。我们还想到逻辑,想到精确。我们主持人刚刚也谈到加里·金教授,哈佛大学的加里·金教授,他提出一句话,大数据是什么?大数据是一场量化的革命。我们说数据它就是一个量化的一个工具,而量化,所有的科学都是为了量化。量化是科学的本质,如果没有量化的话那就没有科学,所以我们说数据是科学的语言,是科学的载体。

我们说在进入信息时代之后,数据的内涵是在扩大的,发生了一个变化,什么变化?我们计算机产生了,数据库出现了,我们把所有的东西放到数据库里,结果呢数据的内涵就扩

大了,音频也放在里面,视频也放在里面,图形也放在里面。到信息时代的时候呢,数据已经开始指代信息了,它不是传统的有根据的数字了,就它内涵扩大了,成为信息的代名词了。

还有一个更重要的变化,那就是体量在扩大,容量在扩大,那怎么扩大法呢?我们可以举一个例子,我们说过去五十年,《纽约时报》所有的容量是三十亿单词,但现在我们仅仅一天微博上就是八十亿单词。相当于一天的这个数据量,就相当于过去一百多年的报纸的数据容量。

所以上世纪八十年代的时候,很多学者就开始注意到这个问题了,他们就开始来定义大数据。到底多大才算大呢?当时宾夕法尼亚大学的一个教授定义了一个叫两百太是吧,两百太的数据,他说叫做大数据。那两百太到底是多大呢?一千吉(赫兹)呢就是一个太,一部电影大概是一个吉,那两百太呢就相当于二十万部电影。当时的定义就是这样,二十万部电影的容量就是大数据了,就是大数据。那我们人类现在这个信息总量呢,我们说在这里啊,泽,我们现在大概是一个泽左右。

二、大数据的成因

我们有了这个概念之后,我们就来谈大数据是怎么形成的,成因是什么,为什么我们何以走到今天对吧?我们走到今天不仅仅是一个数据的积累,从进入信息时代之后,我们1946年发明第一台计算机进入信息时代,到现在60多年了,我们其实克服了很多困难,有很多的技术进步,才把我们推动到了今天。我们说第一个是什么,第一个就是1965年提出来的这个摩尔定律,1988年提出来的普适计算。1989年提出来的数据挖掘,我们说还有2004年出现的这个社交媒体,就这些现象集体地推动,才出现了这个大数据。我们来看看它具体怎么推动的。

1965年的时候呢,英特尔的这个联合创始人摩尔他就发现一个规律,他说一个集成电路,一个芯片上,同一个面积上的晶体管,一到两年这个数量就要增加一倍,现在我们一个微处理器,上面的晶体管大概是几十亿个,就晶体管越做越小,越做越小,当然材料就越来越少,价格越来越低。同一个面积上不停地增加,它的性能就越来越好,导致了一个什么呢,就是这个计算机的性价比不断提高,价钱不断降低,性能反而不断提高。我们比如说硬盘,1955年的时候,IBM推出第一款硬盘的时候,那时候一兆就六千美元,我们说一首歌就几个兆了,那时候保存一首歌要几万美元对吧?我们说到1993年的时候,每兆降低到一美元,到了2010年的时候呢,降到每兆不到一美分了。你说半个世纪的存储器的价格是下降了几百万倍,我们说人类历史上没有一种产品在半个世纪,它的价格能下降几百万倍。

大家争论比较多的是说什么?摩尔定律还会不会继续有效?英特尔现在已经发明了3D 晶体管对吧?他们已经用事实证明了,他们说摩尔定律到2020年之前,还会继续有效,就是(价格)还会继续下降。摩尔定律为我们解决一个很重要的问题,它为大数据时代的到来铺平了道路,物理道路,就是再多的数据,再多的信息我可以非常低廉的成本来进行保存。

那我们讲第二个因素,普适计算,在1988年的时候,美国的一个科学家叫马克·维瑟提出来的,他说什么呢?1988年互联网刚刚产生,他说人类的计算浪潮可以分为三股,第一股叫做主机时代,主机时代的时候,计算机奇大无比,很多人共用一个计算机。一台计算机就占了半个房间。好到了上个世纪七十年代末的时候,计算机变得很小了,出现了个人电脑,人手一机,但马克·维瑟说这不是时代的终结,时代的终结是计算机会变得很小很小,它会融入到这个物理环境当中去,那你发现都发现不了。我们今天是不是到了这个时代?我们说我们的手机已经是台计算机了,我们如影随行是吧?我们还有RFID这种射频标签对吧已经很小很小,小的像豆子一样。它是可以接收数据,可以发送数据。现在已经很多的应用,我们可以把这种RFID的标签放到垃圾筒里,垃圾筒满了的时候就发出信号对吧,美国的废城他们就实施了一个这样的项目。这个收垃圾的人员工作量直线下降,原来几十个人收垃圾,垃圾处理队伍现在变成几个人。

无论是摩尔定律还是普适计算,解决的问题都是刚刚主持人说的大容量的问题。大价值的问题一直到1989年我们提出数据挖掘之后才得到解决,1989年的时候,世界计算机协会召开了第一次数据挖掘的年会,标志着数据挖掘开始兴起。我们说数据挖掘是用自动的算法在大量的数据当中得到一些隐藏的关系、模式,总结出新的知识。我们说数据挖掘也是大数据时代大众所津津乐道的话题,其中最经典的例子莫过于某个超市的啤酒和尿布的故事。某个超市在数据当中发现啤酒和尿布它们的销量呈现正相关的关系。为什么是这样呢?经过调查他们发现,母亲在生了孩子之后买尿布的经常是年轻的父亲,他们在买尿布的时候呢,喜欢买点啤酒犒劳自己,那这个就是一个知识。超市利用这个知识把啤酒和尿布捆绑在一起,推动了两个商品的销量,成为了它的竞争性优势。

我们中国也不乏这样的例子,最近华东师范大学有一个报道,我们有一个女生收到了来自校方的一封信,信里面问她你是不是有经济困难?原来是校方的这个数据挖掘系统发现她餐费一直很少,这个女生很感动,但事后发现这是一个美丽的错误,她其实是在减肥。我们教育领域还有一些其他的故事,我们再说美国的威斯康辛州,他们有个学区,他们发现小学生一二年级的小学生经常请假,而且每年请假的这个比率趋向一个恒定,他们就做数据分析。他们发现请假最大的原因就是生病,生病最大的原因是哮喘病。有了这个发现之后,他们在

开学新生入学的时候,就组织家长进行哮喘病的防治讲座,这个很见效。接下来一两年呢,这个学生请假的比率呢就明显下降。我们说在数据当中挖掘出新的知识,数据挖掘给了我们人类使用数据的一个能力。

我们说到2004年的时候,我们信息技术上的又一个革命性的现象出现了,社交媒体出现了。我们说社交媒体对人类社会的影响也是革命性的,我们举个例子,2011年的时候,弗吉尼亚发生了地震,但是我们纽约州的居民距离弗吉尼亚几百公里,他们首先在推特上看到弗吉尼亚地震了,弗吉尼亚地震了,几秒钟之后这个震感才传到纽约州。那我们知道现在信息传播的速度比地震波还要快。

那这个社交媒体对我们的这个大数据时代有什么意义呢?这个意义是决定性的,为什么这么说?我们这个社交媒体产生之前,我们是软件在收集数据,是感应器在收集数据,但社交媒体产生之后,是全世界的网民都开始贡献数据,而且这部分数据很特别,叫做非结构化数据。我们以前软件收集的数据是有严整结构的。我们今天你发微博,他上开心网,他发的微博有可能有一个视频,你发的可能没有视频,有一个图像,说明它结构是乱的。这部分非结构化的数据,也给我们数据分析、数据挖掘带来最大的挑战,这部分非结构化的数据,同时也叫行为数据。当全世界的网民开始贡献数据的时候,这数据真正开始爆炸了,现在社交网络仅仅产生八年多,但非结构化数据已经占人类数据总量的75%。大家可以想像,所以说社交媒体产生之后,大数据时代就一锤定音了。

解说:伴随着大数据时代的到来,数据与计算的内涵都发生了改变。人类将会迎来一个数据爆炸的时代,那么大数据到底是如何改变我们的生活方式?又怎样能够实现社会治理?世纪大讲堂,《大数据生活方式与社会治理》正在播出。

三、大数据的影响

涂子沛:好我们讲到这里,我们再来看看这个大数据的概念,我们现在应该有了一个更深刻的理解,我们说这里有三个等式,大数据等于传统的小数据加上现在的大信息,视频信息、声频信息、图像信息。那么第二等式是大数据等于非结构化的数据,加上结构化的数据,一个百分之二十五,一个百分之七十五。好,第三个也是最重要的,我们说大数据等于大容量加上大价值,容量是现象,价值才是本质。

好,我们有了这种理解之后,我们就知道在这个时代,我们必须转变我们的思维方式,怎么转变呢?我们说原来我们对数据的期待和要求是用数据说话,因为数据代表最精确的事实,最锐利的事实,用数据说话的意思就是用事实说话,但是说在大数据时代这远远不够。

我们现在要做的是要在数据当中寻找新的启迪,挖掘新的知识,总结新的规律,这是大数据时代的思维方式。

好,我们对大数据有了更深刻的认识之后,我们随后要问,大数据对我们的生活究竟有什么样的影响?它把我们带到哪里去?我的一个判断是,我们的社会会兴起一个全计算型的社会。首先我们要知道我们刚才讲了数据的内涵发生了改变,因为数据的内涵发生了改变,计算的内涵也发生了改变。我们说计算已经不是我们传统的加减乘除了,我们刚才说数据不仅仅是传统的、有根据的数字,现在文字也是数据、视频也是数据。举个例子说,你想找到凤凰卫视《世纪大讲堂》的视频,你可能上百度输入关键字《世纪大讲堂》进行搜索,你输入的是文字,得出的是视频。这个也是计算,也就是说搜索就是计算。

我们整个社会、整个世界的计算呢可以分为三种,第一种是物理计算,第二种是有生命现象的计算,第三个呢就是社会计算。好,我们先说第一种物理计算,谈到物理计算呢,我们就不得不提到另外一个概念物联网,我们未来是所有的电器、机器都会装上感应器。连上网络,就会让我们的数据呢会有一个更大的爆炸。我们刚刚谈到,当我们的人开始贡献数据的时候,数据爆炸了,当全世界的机器、电器开始贡献数据的时候,将会迎来一个更大的数据爆炸。

好我们未来的物联网世界是什么样子,我们来看看这幅图,大家看到飞机,一架飞机上有很多重要的机器,我们说未来的物联网,感应器要装到这些重要的每一个部位的机器上,一架飞机上会有很多的感应器,每一个螺旋桨上都有感应器。然后同一个航空公司的飞机组成一个网络,不同的航空公司,世界上全部的航空公司组成一个集群,全世界的飞机之间、机器之间可以互相通信。

我们再看下面这幅图,被称为这是汽车商的一个工厂,位于纽约州的一个工厂,电池厂,被称为工厂2。0,它的工厂里一万六千平方米,但是装了一万个感应器。这些感应器在对工厂的各个条件进行监测。比如说温度,比如说压力,比如说湿度,比如说在生产的过程中,各种的配料,它的一个口号是什么,是让产品产生记忆。就是一个产品送出去,出了工厂之后,如果它有问题了用户反馈有问题了,我们立刻会查找它当时生长时候的条件,追溯它的数据,去确定它的问题。

我们讲了物理计算,我们也提到了生命计算,我们最后要提社会计算。社会计算是大数据时代最大的亮点,因为社会计算,我们的社会治理模式将会发生改变,大家会觉得很奇怪,为什么社会能够计算?我们说社会计算也有很长的、很久远的渊源,我们先从近的说起,我们社交媒体产生之后,我们很多社会科学的研究者发现,通过社交媒体上的数据,我们能够

做出很多推断,你能发现一个人的喜好、偏好、观点、意见,那传统的方式我们要发现一个人的意见的时候,要去做问卷调查。例如说美国的总统选举,原来的传统的预测方式谁能当选?我得一个一个去问,选取有代表性的选民进行询问,完成这个调查,但我们能看到,我们上一届选举这种局面已经完全改变了。奥巴马的当选,投票完了之后就有社会科学的研究者分析了微博上的数据、社交网络上的数据,就宣布奥巴马即将当选,最后奥巴马果然胜出。

他们认为基于这种社交媒体的计算,他们称之为社会计算。另外有科学家相信,我们现在数据越来越多,各种数据现象都被记录了。所以呢未来一切社会现象、社会过程、社会问题都可以计算。还有科学家打出比喻说,我们现在的数据就像一个新的显微镜,我们14世纪的时候发现显微镜,这个显微镜我们把它对准了物理世界,这个显微镜的产生使人类的知识开始爆炸。现在我们大数据这个显微镜对准的是人的行为、社会现象,这将引起社会科学知识关于人本身的知识的一个大的爆炸。

我们说从数据当中去发现规律,用数据来解决社会问题,这种想法其实有更久的渊源。1830年我们的法国哲学家孔德他就提出社会物理学的概念,他们当时也从数据当中得到一些重要的发现,他们在研究自杀率,他们发现伦敦的自杀率无论是在一个经济箫条的时候还是经济繁荣的时候,自杀率几乎是恒定的。就像有一块铁磁石一样,吸引着去自杀。所以他们就提出社会物理学,他们认为社会就像天体一样,存在规律,怎么去发现这种规律呢,就要用数据去发现。但是受限于当时的条件,数据有限,到了我们这个时代,大数据的时代,所以有更多的学者相信,社会计算一定会兴起,用计算、用数据来解决社会问题,是未来的发展方向。

我们再举一个例子,今年4月份的时候,美国有一个很小的报纸迈阿密有一个《太阳哨兵报》,获得了普利策新闻奖,它的发行量只有二十万份,那为什么呢?这个又跟大数据有关。当地发生了一起恶性的交通事故,警察开快车把人撞死了。好,《太阳哨兵报》有一个记者,他就怀疑警察这个群体长期开快车,屡屡发生这些事故,他提出这个怀疑和观点之后,他必须进行证实。你要证实警察开快车,这非常难以取证,唯一的办法跟踪警察,但是这个难度很大。好,他最终想出了一个办法,他利用美国的信息公开法,向交通部门申请公开了获得了警车当地所有的警车过交通收费站的记录。那它选取两个交通收费站计算之间的距离,然后还有时间的记录,距离除以时间就是他们的车速。他获得了一百万条记录,他进行计算之后,就发现在八个月的时间当中,有五千一百辆警车的平均速度超过一百五十公里每小时。可想而知,他这个发现宣布之后,引起了当地警务部门的大地震。有人被开除了,有人要写检讨,有人被剥夺了开警车的权利,甚至引起了全美的大讨论,解决了一个巨大的问

题,这是公民利用数据对公权力进行制约。我们可以想像如果没有数据,如果没有大数据,这种问题基本上得不到解决。

好,我们今天讲了这么多,我们最后总结一下,有三个要点。第一,我们说大数据不是一个孤立的现象,大数据是诸多的信息技术浪潮、信息技术革新在一起交互作用产生的。我们说我们人类的数据还要上升。第二大数据对我们的影响是,我们将迈进一个智能型的社会,在这个智能型社会当中,我们人,我们的生活会越来越依赖数据、依赖计算机、依赖网络,进入一个人机共生的状态。最后我们会进入一个全计算型的社会,最大的亮点是社会计算,整个社会计算的兴起,将改变我们社会治理的模式,好了,我的演讲就到这里,谢谢大家。

解说:大数据时代将给企业带来无限商机,但又如何与个人息息相关?美国棱镜门事件敲响警钟,大数据时代该如何保护个人隐私?大数据的革命又何时能够在中国成功落地?《世纪大讲堂》《大数据生活方式与社会治理》正在播出。

四、现场提问

田桐:感谢您刚才的精采演讲,我们现场的观众朋友们呢,有一些问题想和您进行交流的。

涂子沛:好的。

田桐:来,有问题的。来,中间这位男士吧。

观众:涂老师好,主持人好,其实很容易理解大数据时代对于企业的价值,那对于我们个人来说,会带来哪些有帮助的事情呢?我们应该如何去建立自己的这个数据库呢?谢谢。

涂子沛:对个人来说,那当然有很多相关的地方,我想说的第一个相关的地方,就是说数据是知识的载体,你要从数据当中发现新的知识,你要重视数据。我们说你去做研究也好,恐怕做现场调查还不如系统的收集数据,获得数据,系统的数据也许比亲身去调查也许还有作用,这是第一。第二呢,数据是隐私的载体,你的个人数据是你的个人隐私,我们说还有这个时代,数据还是个人权利的载体,PM2。5是多少,你是有权利知道的对吧,你的自来水里面各种微生物的含量是多少,各种类金属的元素的含量是多少,这些都是数据。它是成为一个权利的载体,个人跟个人的生活是息息相关的。

观众:涂老师好,主持人好,就是我们毋庸置疑,大数据时代对我们社会生活,商业或者学术方面都有很多的便利,但是美国棱镜门事件也将我们带入了对大数据时代的一种恐慌。就是我们在这个数据时代,怎样保障您刚才提到的隐私呢?谢谢。

涂子沛:隐私和商业的利益是我们需要一个平衡,在新的大数据时代,但这种平衡在每

个社会呢都在形成当中,美国社会也做得不是很好。我们中国社会在这一方面会更糟糕一点,商家为了利益不断侵犯,用数据来侵犯大众的隐私,这就需要整个社会形成一个新的意识,不断地公众不断的去跟商家博弈,整个社会形成新的法律,那商家不能够随便挖掘这个用户的数据,挖不挖应该是由这个用户来说了算,他要对这个数据有主导权,这需要有新的法律,来对这个进行规范,需要立法。

观众:涂老师您好,我是做舆情分析的,我想问一个跟自己工作有关的一个问题,就是因为我们经常要在一个突发事件之后,来预测这个民意的倾向,预测民意的走势,我就想问一下就是我们收集多少数据,您觉得才足以对一个民意做一个相对准确的预测。然后我们大概要分析到什么层次,才能做这样一个预测?还有一个问题就是我看您在书上写这个数据,就是政府对数据的公开是非常重要的,前一段时间,就是国家统计局建立了一个网上的一个数据中心,可以就是免费地去下载一些关于国计民生的,还有经济方面的这种重要的数据。我想问一下您对它这个做法您是怎么看的?然后它现在公布的数据您觉得是否就是您觉得它质量如何、数量如何,我们可以怎样利用这些数据?谢谢。

涂子沛:我想我的建议是需要多元的数据,多个源头的数据,来印证一些民意,而不是单元的。比如说分层次的多元的,不仅仅,比如说你做得最多恐怕是微博的数据对吧,那我们说微博的数据还不够对吧,如果仅仅用微博,大部分用户是年轻的用户对吧,你还得用其他的数据比如说问卷调查、街头访谈,多元的数据来互相印证一个观点,这是第一个。第二个国家统计局在做的这个事情,无疑是符合世界潮流的一个事情,把数据公开开了,开放出来,让大家来使用,我觉得国家统计局还可以做更多的事情,而不仅仅是公开,把原始数据开放出来,举行一些竞赛在高校,调动大家来使用这些数据。

观众:涂老师好,主持人好,我是一名互联网行业的从业者,那么作为互联网行业的话呢,肯定是对信息革命的这个接受程度、开放程度最高的,那么我们也希望您能给大家预测一下,大数据,或者本身这个大数据的革命,在国内能够落地或者能够很好的一个爆发之后,这个需要多长一个时间?也给我们从业者一个鼓励吧,这是第一个问题。第二个问题的话是一个个人行为,就是我们现在可能由于这个数据挖掘等一些水平还不是特别的发达,我们比方在一些电子商务网站网购之后,那可能我本身是一次性购买的行为,但商家不断地给我推送一些他所谓的猜你喜欢的,还是说类似的商品你可能会购买,但是对我已经产生一个困扰,我怎么样能够对我进行一个很好的保护,希望得到您的回答,谢谢。

涂子沛:好,我们先从回答第二个问题起,刚刚说的,就是说在这个时代呢,其实你在获得一些便利,你把自己的数据推出去之后,你的行为被它记录了,它根据你记录的数据来

猜你喜欢什么,不断向你推送什么,有些东西确实是你喜欢的,你是得到了便利,但是呢一定程度上又对你形成了骚扰,所以我们说最终这个权利应该把它给到用户当中去。就用户我来决定我开不开放这些数据,你能不能使用这些数据对我进行挖掘,如果我有选择权,我愿意享受这种便利,那你就能挖掘我的数据,我接受你的推送。那这有很多种方式对吧,可以在事前控制也可以在事后控制,事前给你一个选项,事后还可以给你一个选项,你愿不愿意继续接到我们对你的推送,如果取消你不再接到对吧,所以还是基于商家有一种自觉,对这个用户的一种尊重。但是商家的这种自觉跟尊重,我们说不会从天而降对吧,是要大家去说不,当整个社会都说不的时候,当立法者意识到这个问题的时候,新的法律出来的时候,这个问题才能得到最根本的解决。好,那你前面那个问题,我想大数据的落地,其实在中国已经有很多项目在落地了。我相信在五年之内吧,我们能看到越来越多的项目,在遍地开花。

观众:涂老师您好,就是我们曾经探讨过一个有趣的问题,就是我们死了以后,我们QQ怎么办?就是说呢,在这个大数据时代,它的数据的量是非常规模庞大的,那么会不会相应的产生一些数据垃圾?那么这个会对我们实际生活有没有影响?那么这个数据垃圾我们又该怎么面对?怎么办?谢谢。

涂子沛:好,这个问题两个问题,其实第一个问题数据遗产的问题,这都是新的伦理的问题,第二个是数据垃圾的问题。那对数据遗产呢,现在有很多种处理方式,西方国家也在立法,谁能继承你的这个遗产。为什么我们说这个时代是一个革命?因为有很多新的问题在出现,相信这个问题在中国,我们整个社会是迟早要面临的。我们说我们现在的网上聊天用户大多是年轻的一代,但是二十年之后呢,我们是不是应该有这种前瞻性,现在就对这些问题进行思考呢?这显然还没有提上我们国家立法者的议程。

田桐:那么就您看来怎么解决这个问题?

涂子沛:立法,谁能继承?肯定是有第一继承人,有第二继承人,有遗嘱对吧,整个社会要形成一个观念,你的数据是你遗产的一部分,现在已经出现了这些事情了,就是美国就出现这种事情了,有人自杀了对吧,他自杀之后,警方为了了解他自杀的原因对吧,就想去登录他的各个帐号,那警方有没有权利这样做呢?那社交网络给不给他这样干呢?他身边的亲人也都想了解,那他的隐私权在哪里?整个社会我们能看到很多问题。就个人方面,你首先把数据当做你的遗产,然后国家层面、社会层面要制定合适的法律来规范这个问题。

田桐:那么像刚才她说的第二个问题,这些庞大的数据的垃圾,我们应该怎么去处理?

涂子沛:这对商业公司是一个挑战,比如说qq网络聊天工具,我们毫无疑问,它在积累大量的数据垃圾,它可能在公司内部会有一个政策,是多少年对什么样的数据要做出什么

样的清理。我们还能看到数据的累积当中它是有一些规律的。我们说有价值的数据,它上升的趋势是比垃圾上升的趋势是要缓慢的,就垃圾数据的这个上升趋势更快。有价值的数据呢上升得更慢,那对这个比如说网络聊天工具,它就要做一些考虑对吧?一种是删除,最简单的方式,还有一种是转移,它转移到更低成本的这个存储器上去。

田桐:感谢您刚才的精彩解答。2013年5月,阿里巴巴董事局主席马云在其卸任演讲的时候说,在我们还没有了解PC的时候,移动互联网来了,在我们还没有了解移动互联网的时候,大数据来了,大数据带给我们的绝不仅仅是一个商业模式或者技术,而是我们开启全新世界的方法论。再一次感谢涂老师的精彩演讲,感谢您收看这一期节目,下一期再见!

大数据时代社会治理方式创新

大数据时代社会治理方式创新 编者按:互联网、物联网、大数据、云计算等现代技术正在深度改变人们的生活、工作和思维方式。大数据时代给社会治理提出了新机遇和新挑战,因此,应适应大数据时代社会需要,变革社会治理方式。推进大数据时代社会治理方式创新,无论从理论上还是实践上看,都是一个全新的课题。作为我国改革开放的前沿地带,深圳市福田区在运用大数据手段推进社会治理方式创新方面再一次走到了全国的前面,率先进行了探索,对于研究大数据时代社会治理方式创新,具有重要的理论和实践意义。深圳市福田区社会治理方式创新的实践探索 大数据时代,只有让政府以及各社会主体在合理共享各种最新数据的基础上,发挥各自的优势,深度挖掘数据的价值,在提供公共服务的方式、内容和机制上不断创新,以适应快速变化的社会需求和环境,才能不断提高我国的国家治理能力和实现社会治理方式的创新。深圳市福田区充分认识基础数据的重要性,在如何保证动态、精准、充分占有基础数据方面进行了卓有成效的创新和探索。突出大数据理念 针对大数据时代社会治理的特点,深圳市福田区在推进

社会治理创新方面,树立大数据理念,推动智慧福田建设。 大数据应用的核心是数据处理。大数据应用要充分挖掘数据价值,进行深度应用。为此福田区提出实现“让数据多跑腿,让群众少跑路”的目标,以“采、用、享、碰、推、嵌”六个字来概括数据应用理念。 “采、用、享”是传统的数据应用,是信息化建设的第一 次革命;“碰、推、嵌”是大数据时代的智能应用,是信息化 建设的第二次革命,以“碰、推、嵌”的可视化倒逼“采、用、享”的进一步质量提升,指导前期系统的改造。其中“碰”即数据碰撞。如将街道计生执法、人民调解、安监执法、派出所接报的发案的出租屋,与未自主申报出租屋比对碰撞,推送给街道综管执法人员,通过发现问题推动执法,推进自主申报工作。“推”即智能推送。如福田的智慧政务开发了智慧福 田门户APP和微信公众平台,辖区居民只要安装或关注, 平台就会根据本人实际需求,有针对性地自动推送服务信息。“嵌”即智能嵌入。如可以将业务办理规则嵌入网格移动终端,如一旦采集满足条件自动推送。 树立“法治与证据”理念。大数据时代也是法制时代。改 善大数据时代的社会治理,要进一步强化证据意识。福田区

大数据条件下社会综合治理的路径研究及对策

大数据条件下社会综合治理的路径研究及对策 十八届三中全会提出,要推进国家治理体系和治理能力现代化,政府治理体系和治理能力是国家治理能力的重要方面,社会综合治理工作应该是国家治理体系和治理能力中的应有之义。当前,电脑、移动终端、各种应用软件的广泛使用,海量数据的收集和分析,使得大数据(Big data)几乎渗透到了社会生活的方方面面。因此,大数据时代的来临及广泛应用为破解社会综合治理难题,提升社会综合治理能力提供了新的机遇。 一、社会综合治理存在问题 所谓社会综合治理,就是政府、社会组织、企事业单位、社区以及个人等社会主体通过平等的合作型关系,依法对社会事务、社会组织和社会生活进行规范和管理,最终实现公共利益最大化的过程。综合治理不仅涉及合理有效地配置社会资源,比如提供教育、文化、卫生、体育、社会保障等社会公共服务和公共产品,保障社会公平与公正,而且也涉及通过行政或者司法的手段保障社会安全和社会稳定。此外,社会综合治理目标实现以及时、全面地掌握治理对象的状况和外部环境的信息为前提。现阶段,我国正处于社会转型的加速期。随着社会的快速发展和急剧变迁,包括人、财、物、事等在内的社会综合治理信息变得愈发庞大和复杂,而这与当前大数据技术的发展正好不期而遇。当前的社会综合治理工作与大数据时代的要求还存在以下四点不相适应。 (一)社区社会综合治理认识与大数据要求不适应。(二)社区社会综合治理工作运行机制与大数据要求不适应。(三)社会综合治理队伍素质与大数据时代要求不相适应。(四)社区社会自我管理制度与大数据要求不相适应。 二、大数据时代社会综合治理的路径研究 早在1991年,耶鲁大学计算机系教授戴维·杰勒恩特就指出,互联网的终极世界是“镜像世界”。“镜像世界”如同人在镜子中的映像那样,镜像世界和现实世界本身存在着真实的关联和表达。镜像世界虽然是现实世界的“镜像”,但“镜像世界”又有相对独立性,即“镜像世界”以结构化、非结构化、半结构化数据的大量化、多样化、快速化积累和扩张,并冠名为“大数据”而区别于现实世界。因此大数据时代的社会治理研究,必须以“现实世界”为基础,更应突出关注“镜像世界”。 社会治理研究对象和路径的“双重性”,要求我们辩证地认识与处理“双重性”的关系。伴随着网络世界与人类生存的进一步对接,在新的科学技术的基础上,现实生活中的非线性关系开始以非结构化数据的形式在网络空间里映射,这个过程就是网络空间拟像真实世界的过程。 一个现实世界的镜像版本如果想区别于网络社会早期的“虚拟世界”而具有一

2017公需科目考试《大数据时代的政府治理创新》答案

2017公需科目考试《大数据时代的政府治理创新》答案 考试时长:60分钟考生:XXXX总分:100 及格线:60 考试时间:2017-12-05 11:34-2017-12-05 12:01 100分 ? 1.Web2.0强调(D)。(单选题3分)得分:3分 ? A.单位 ? B.网站 ? C.机构 ? D.个人 ? 2.科学范式的发展路径:从观察到演绎分析、模型推导,到计算机分析、仿真模拟,再到(C)时期。(单选题3分)得分:3分 ? A.数据推导 ? B.理论科技 ? C.数据科学 ? D.数据计算 ? 3.政府2.0不以政府为中心,而是以公众为中心,建设(C)政府。(单选题3分)得分:3分 ? A.开放型 ? B.节约型 ? C.服务型 ? D.创新型

? 4.社会成员或者用户之间社会成员之间共同参与信息的处理、信息的分享、信息的传播,这个活动就叫(D)。(单选题3分)得分:3分 ? A.政府计算 ? B.高强度计算 ? C.云计算 ? D.社会计算 ? 5.(A)时代,使得信息智慧解读时代到来。(单选题3分)得分:3分 ? A.Web3.0 ? B.Web4.0 ? C.Web2.0 ? D.Web1.0 ? 6.具体来说,摩尔定律就是每(D)个月,产品的性能将提高一倍。(单选题3分)得分:3分 ? A.6 ? B.12 ? C.16 ? D.18 ?7.(C)说明如果联网越多,从介入方式、技术上越来越突破,则网络规模越大、成本越低,网络的成本可能会趋向于零。(单选题3分)得分:3分 ? A.新摩尔定律 ? B.梅特卡尔夫定律 ? C.吉尔德定律

企业大数据管理解决方案

企业大数据管理解决方案 摘要:大数据的应用方兴未艾,根据国内企业的应用场景,给出了企业大数据管理解决方案。此方案还为数据的进一步处理打下了基础。关键词:大数据; 企业大数据管理 IT行业一直在不断地努力,以最佳方案满足日益增长的各种需求。继云计算之后,大数据又成为业界关注的热点。云计算更多地体现在它的商业模式与服务模式上,而大数据则更关注数据的处理,而这些纷杂的数据则是关系社会、企业乃至个人生活的核心关键,可以说数字时代数据为要。1 大数据参考架构通常人们认为大数据具有4V特点,即:Variety(多样性)、Volume(大容量或海量)、Velocity(快速)和Value(价值)。至于大数据的严格定义,则是人者见人、智者见智,莫衷一是[1]。根据调研与实践,本文给出了相关的参考架构,。 可以将大数据的参考层次分为4个: (1) 数据采集。主要涉及对数据源的采集,包括各种结构化与非结构化数据、静态数据与动态实时数据等。(2) 数据存储。主要涉及对数据的存储,包括分布式存储、海量存储、虚拟存储等。(3) 数据处理。主要涉及对数据的转换、传输、分发等。 (4) 数据分析。主要涉及对数据的清洗、比对、挖据、钻取等。同时,按照数据平台管理、数据维护、安全保护等维度,存在着贯穿各层的管理机制,即: (1) 系统管理。对构建的系统平台进行管理与维护。 (2) 数据管理。按照数据生命周期对数据进行管理。 (3) 安全管理。对数据隐私、数据安全、访问安全、系统安全等方面进行管理。2 企业大数据解决方案由于大数据的应用很多,本文更加关注企业所处的混杂数据的应用场景,基于上面给出的参考架构,给出相应的解决方案。2.1 应用场景企业的数据是企业的核心资料,企业信息化的核心问题就是数据的应用的效率与效果。目前企业的数据主要包括:财务类数据、管理类数据、业务类数据等,这些数据可以是结构化数据和非结构化数据。从容量上看,随着信息化应用的不断提高,可以达到GB或TB级,对于一些行业,甚至有可能达到PB级。2.2 解决方案本文提出的企业大数据解决方案是从业务连续性的角度来考虑用户数据的问题。参考了业界流行的ISO20000、ISO27000、BCP/DRP、SOA等相关标准和技术,从安全、服务的范畴来管理数据、保护数据、使用数据。方案主要解决企业用户的结构化与非结构化数据的存储、管理,为企业相关应用提供基础数据,为企业的业务连续性保驾护航。2.2.1 技术特点方案主要融合了信息安全技术、数据管理技术、数据同步复制技术、数据库技术、商务智能技术等,区别于现有的数据备份产品、数据复制产品、数据管理产品,更关注数据在复制之后能够被快速使用与恢复,以延续业务的连续性。方案为用户数据的进一步加工处理打下了基础,有助于用户整合数据、整合应用、数据加工、商务智能、决策分析等。主要特点:(1)支持多种数据库的不同版本,也支持多种异构数据库之间的同步,如Oracle、SQL Server、MySQL、Sybase、DB2、AS400等可以同步到Oracle 数据库或其他数据库上。 (2)支持一对一、一对多、多对一、多对多等异构数据库同步方式。 (3)比较强的数据加工能力,可以选择数据源的不同字段,也可以对数据源做相应的转换、逻辑判断、映射等处理,还可以设置在数据同步时做异常数据检查等。 (4)比较强的传输能力,内置数据传输平台,满足复杂网络情况下的数据可靠传输,支持广域网下的数据同步,支持跨网段的数据同步,支持物理隔离情况下的数据同步。 (5)易用性。提供中文工具,方便可视化操作和监控。2.2.2 技术原理统一支持结构化数据和非结构化数据的同步及相应加工。提供可视化工具配置结构化数据和非结构化数据的同步与加工。 (1)非结构化数据文件既可以通过系统内置的传输平台同步到备份方的文件夹下,也可以将备份方文件夹下的数据文件映射到数据库上。对于非结构化的文件备份,可以在数据源方部署一个节点,负责监控和发送文件,通过可视化配置的数据推送服务,选择要发送的文件夹、文件、接收节点、接收文件夹等信息,通过定时等调度策略将文件发送到备份方。当然要发

大数据时代社会治理方式创新

大数据时代社会治理方式创新

大数据时代社会治理方式创新 2014年12月08日09:08 来源:学习时报 原标题:大数据时代社会治理方式创新 编者按:互联网、物联网、大数据、云计算等现代技术正在深度改变人们的生活、工作和思维方式。大数据时代给社会治理提出了新机遇和新挑战,因此,应适应大数据时代社会需要,变革社会治理方式。推进大数据时代社会治理方式创新,无论从理论上还是实践上看,都是一个全新的课题。作为我国改革开放的前沿地带,深圳市福田区在运用大数据手段推进社会治理方式创新方面再一次走到了全国的前面,率先进行了探索,对于研究大数据时代社会治理方式创新,具有重要的理论和实践意义。 深圳市福田区社会治理方式创新的实践探索 大数据时代,只有让政府以及各社会主体在合理共享各种最新数据的基础上,发挥各自的优势,深度挖掘数据的价值,在提供公共服务的方式、内容和机制上不断创新,以适应快速变化的社会需求和环境,才能不断提高我国的国家治理能力和实现社会治理方式的创新。深圳市福田区充分认识基础数据的重要性,在如何保证动态、精准、充分占有基础数据方面进行了卓有成效的创新和探索。 突出大数据理念 针对大数据时代社会治理的特点,深圳市福田区在推进社会治理创新方面,树立大数据理念,推动智慧福田建设。 大数据应用的核心是数据处理。大数据应用要充分挖掘数据价值,进行深度应用。为此福田区提出实现“让数据多跑腿,让群众少跑路”的目标,以“采、用、享、碰、推、嵌”六个字来概括数据应用理念。 “采、用、享”是传统的数据应用,是信息化建设的第一次革命;“碰、推、嵌”是大数据时代的智能应用,是信息化建设的第二次革命,以“碰、推、嵌”的可视化倒逼“采、用、享”的进一步质量提升,指导前期系统的改造。其中“碰”即数据碰撞。如将街道计生执法、人民调解、安监执法、派出所接报的发案的出租屋,与未自主申报出租屋比对碰撞,推送给街道综管执法人员,

XXXXX201X年大数据治理工作方案

XXXXXX 201X年度大数据治理工作方案 随着信息技术的飞速发展,XXX行业信息化建设在经过了单一应用、综合应用和深度应用等阶段后,正高速向智慧应用转型。自信息化工作开展以来,我单位陆续建设和部署了多种信息系统,这些系统的建设和使用,一方面实现了本单位的日常工作信息化,另一方面也产生和储存了大量的数据,这些数据不但体量庞大,而且文档、图像、音视频等半结构化和非结构化数据所占比重也大幅度增加。为管理好这些数据,进一步处理、分析和利用好这些数据,为XXX行业的预测预警预防预控和科学决策提供有力的依据,提高工作效率和快速反应能力,切实提升领导获得感、工作人员获得感和群众获得感,特制定此工作方案。 一、工作目标 数据治理是指将数据作为组织资产而展开的一系列的具体化工作,是对数据的全生命周期管理。开展数据治理工作的目标是提高数据的质量(准确性和完整性),保证数据的安全性(保密性、完整性及可用性),实现数据资源在各部门间有效共享;推进信息资源的整合、对接和共享,充分发挥信息化作用,提升整体信息化建设和应用水平。 二、现存问题 —1—

我单位各业务部门因自身业务开展均有自己的信息系统,且信息系统的信息数据以其纵向的行政管理而相互独立。由于信息系统开发的历史原因,系统之间的相互联系较少,数据格式相对独立,数据共享以及相互利用的程度较低。目前XXX行业已经在部、省、市建立了大量的应用系统,网络以及软硬件设施也有了一定的规模,更为重要的是,经过多年的建设已经积累的大量业务数据。虽然国家部委三令五申要求通过信息资源服务平台统一开展数据资源归集和共享事宜,但现阶段我单位数据管理方面仍存在以下的不足: (一)业务系统分散建设。各业务部门按照要求或为应对迅猛变化的信息化需求,逐步建立了各自的信息系统,各部门站在各自的立场生产、使用和管理数据,使得数据分散在不同的部门和信息系统中,缺乏统一的数据规划、可信的数据来源和数据标准,导致数据不规范、不一致、冗余、无法共享等问题出现,各部门对数据的理解难以应用一致的语言来描述,导致理解不一致。 (二)缺少统一的主数据。我单位几大核心基础信息系统之间的主要信息分散存储在不同的独立系统中,系统间没有通过统一的业务管理流程进行维护,无法保障主数据在整个业务范围内保持一致、完整和可控,导致业务数据正确性无法得到保障。 (三)数据资源多头管理。信息系统的建设和管理职能分散在各部门,致使数据管理的职责分散,权责不明确。各部门关注数据的角度不一样,缺少一个组织从全局的视角对数据进行管理, —2—

大数据时代下社会治理创新

大数据时代下社会治理创新 国商1418 15号 刘静娴当今,大数据伴随着云计算、物联网、移动互联网的发展,正在对全球经济社会产生巨大的影响。大数据时代给社会治理提出了新的挑战,要求我们把握大数据时代社会治理的特点,变革社会治理的研究方式,适应大数据时代社会治理的需要。 现阶段,我国正处于社会转型加速期。随着社会的快速发展和急剧变迁,包括人、财、物、事等在内的社会治理数据和信息变得越来越庞大和复杂,而这与当前大数据技术的发展正好不期而遇。针对目前社会治理领域普遍存在的服务理念滞后、决策机制不够科学、部门协作亟须加强、工作效率亟待提升等问题,大数据技术从认识、理论、方法、实践和效果评估等方面都能给人们全新的视野,为社会转型期的社会治理创新带来了机遇。 1.重视大数据在社会治理中的重要价值 提供政策制定的依据,提高科学决策水平。政府的决策离不开数据资源的支撑。政府部门是社会治理的主导者,在出台社会规范和政策时,通过对大数据整理和分析,探寻数据间的相关性,从中找到隐藏在数据背后的规律性信息,并将数据的处理分析结果转化为政策决策的依据,这样就可以减少因缺少数据支撑而带来的偏差,从而提高决策水平和公共服务的效率。当前,大数据也逐渐成为政府公共决策、

企业经营决策的重要手段,数据领域流行的说法是“更好的数据意味着更好的决策”。譬如城市智能交通,可以通过公交刷卡记录、手机信号源等方式来展开城市公交客流信息的全数据分析,从中挖掘出客流量、客流聚集点、交通拥挤点等有效信息,从而为城市公交线路的合理规划和站点的设置提供重要的决策参考,使大多数人能够享受到及时、方便的交通服务,提高公共交通的出行分担比,缓解城市交通的拥堵。 了解社会公众的需求,提升社会治理与服务能力。了解并满足公众的需求是社会治理的核心理念,社会治理与服务就是一个不断发现并满足公众需求的过程。当前,大量社会矛盾问题产生的一个重要根源是公共服务机构不了解社会公众的真正的利益诉求,从而无法有效地提供公共服务和产品。实际上,大数据背后隐藏的是各种公众需求的信息。这些需求是人们通过QQ、微博、微信、论坛等各种网络平台的互动交流和交往中表现出来的,其背后就是人们的各种情感、兴趣、价值观和利益诉求等有用信息。因此,政府可以借助来自互联网和社会化媒体的丰富数据资源,以此来了解人们的心理活动和利益诉求,并依托各种网络互动平台方式,促进政府和公众互动,获取公众的各种个体需求和公共需求,为公共服务与产品的提供奠定基础,促进社会治理与服务能力的提升。 预测人们的行为趋势,促进社会矛盾的消解。大数据的挖掘和运用包括两个侧重点:描述性分析,主要是针对过去,揭示规律;预测性分析,面对未来,预测趋势。从了解需求到掌握舆情,再到预测行

大数据时代的基层社会治理创新

摘要:本文在介绍和评述大数据时代基层社会治理创新典型案例的基础上,探索出一条借助于大数据加强基层社会治理创新、以现代信息手段推进社区管理和服务的新路,为大数据时代的基层社会治理创新提供了重要启示。 关键词:大数据基层社会治理创新网格化服务信息技术互联网 大数据是继互联网、物联网、云计算之后,又一新的技术革命,它标志着人类社会正从信息时代、知识时代向智能时代迈进。大数据时代为基层社会治理创新提出了新的机遇和挑战,大数据时代,如何把大数据技术运用到基层社会治理中,是一个需要各级政府认真思索和深入研究的问题。 最近,我们对抚顺市高山社区利用大数据来创新社区治理的实践进行了多次调研,了解到该社区在社区管理和服务中,尤其是在基层社会治理中,具有大数据思维,使用了大数据技术,取得了非常好的效果,这种做法值得参考和借鉴。 一、高山社区以大数据推进基层社会治理创新的基本做法 高山社区位于辽宁省抚顺市顺城区北部高尔山脚下的城乡交界处,是2006年底棚户区改造后回迁的。2012年,高山社区在抚顺市率先垂范实行网格化管理。利用大数据思维以及使用大数据技术,将高山社区划分成5个网格,形成“人到格中去,事到格中办”的管理和服务模式。将环境整治、维稳综治、安全生产、民生保障和便民服务等工作下沉到网格,构建以大数据为依托的全方位社区服务框架。社区管理和服务形成崭新氛围,获得全省远程教育示范站点、全省就业示范社区、全省学习郭明义先进社区、全省打击传销示范社区、全市文明社区和全市和谐创建先进社区等荣誉称号百余项。 (一)完善基础信息采集,建立社区服务信息库 拥有真实可靠的数据信息是大数据应用的前提和基础。高山社区结合网格化管理,借助“一图两表四册”入户采集信息。采集整理的数据分为基础数据、政务管理和公共服务三大类,把房屋数据、人口数据和社会组织等划分为基础数据,把走访数据、党建数据和舆情数据等划分为政务管理数据,把服务数据、政策公告、医疗数据和活动数据等划分为公共服务数据。构建“问需于网格、分解整合、零距离服务”的数字化管理和服务平台,从而为居民提供精细化的服务。 (二)以居民需求为导向,创新社区管理和服务 (三)以服务居民为宗旨,实施社区网格化服务 二、高山社区以大数据推进基层社会治理创新的显著效果 大数据时代,大数据是提高治理水平和提升治理能力的重要方法和措施,高山社区以大数据推进基层社会治理创新,成效显著。 (一)提高了社区管理和服务能力 中国共产党的根本宗旨是全心全意为人民服务,而应用大数据的终极目的也是利用数据信息的价值性为人类社会服务。如何满足居民日益增长的物质和精神需求,如何依法保障居民的各种权益,如何使居民得到更多实惠,是高山社区为奋斗目标。一方面,实施惠民工程,强化社区公共服务效能。为了使居民可以自由参与、主动发声,高山社区创建了社区论坛。利用这个互联互通的对话空间以及发声渠道,各利益主体实现了线上对话和线下协商。社区居委会可以及时地发现居民的利益诉求,通过“两代表一委员”进社区,组织线下的协商协调,圆满地解决了困扰居民多年的难点和热点问题。另一方面,强化志愿服务,加大社会组织的培育。高山社区基层社会治理创新模式的成功有一个重要的原因是建立了社区、居民、政府和企业的共赢机制,这也是社区治理可持续发展的一个重要保证。高山社区有效发挥党员先锋模范带头作用,积极向政府寻求帮助,吸引辖区企业和民间组织参与社区治理。 (二)增强了社区居民自治能力

浅谈大数据与社会治理创新文

浅谈大数据与社会治理创新 当前,我国正处全面深化改革的攻坚期,全面建成小康社会的冲刺期。党的十八届三中全会强调,围绕推进国家治理体系和治理能力现代化目标,不断创新社会治理体制。这与当前大数据技术的发展正好不期而遇。大数据伴随着云计算、物联网、移动互联网的发展,正在对全球经济社会产生巨大的影响。针对目前社会治理领域普遍存在的服务理念滞后、决策机制不够科学、部门协作亟须加强、工作效率亟待提升等问题。大数据技术从认识、理论、方法、实践和效果评估等方面都能给人们全新的视野,为社会转型期的社会治理创新带来了机遇。大数据时代给社会治理提出了新的挑战,要求我们把握大数据时代社会治理的特点,变革社会治理的研究方式,适应大数据时代社会治理的需要。 一、大数据的概念及特征 大数据,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样的捷径,而采用所有数据进行分析处理。 大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实性)。 二、大数据对政府创新社会治理的战略意义

1、促进社会治理体制从碎片化到网格化的转变 当前,社会治理碎片化是我国社会治理体制存在的主要问题,具体表现为:承担社会治理职能的各政府部门各自为政,协同性不足,同时不同部门的职能之间存在交叉和重叠,“信息孤岛”和“信息打架”现象并存。这种碎片化的社会治理体制使我国的社会治理陷入高成本、低效率的困境。随着大数据时代的到来,社会治理大数据成为可供所有社会治理主体使用的公共产品。在这种情况下,实现社会治理大数据的完全共享,不断提升其使用效能、效率和效益,将有助于推动各社会治理主体之间的协同与合作,进而促进社会治理体制从碎片化向网格化转变。 2、促进社会治理方法从以有限个案为基础到“用数据说话”的转变 长期以来,基于少数人的社会治理需求推断、预判多数人乃至整个社会现时的或者未来的社会治理需求,基于部分地区的社会治理经验推断整个地区乃至整个国家的社会治理政策和措施,是一种在我国占主导地位的社会治理思维。这种以有限个案为基础的社会治理思维具有非常明显的局限性,主要表现在以下两个方面:一是未充分考虑到社会各阶层、各群体社会治理需求之间的差异性;二是对我国不同地区之间经济社会发展不平衡的基本国情缺乏足够的重视。在大数据时代,社会治理大数据的价值在于提高社会治理决策的科学化与社会治理过程的精细化。为了实现这一目标,各社会治理主体须对原有的社会治理方法进行根本性的变革,着力培养大数据意识,促进相关数

大数据生活方式与社会治理课程实录(涂子沛)

大数据生活方式与社会治理课程讲稿 前言 田桐:学术前沿,思想对话,欢迎走进《世纪大讲堂》。如果有一天你看到一辆无人驾驶的车辆行驶在公路上,或者有一天看到一台打印机能够完完全全打印出你想所要的所有东西的话,那么你不必讶异,因为您已经进入到了大数据的时代。正如哈佛大学社会学的教授加里·金所指出的,这是一场革命,庞大的数据资源已经使得各个领域开始进入到了信息化的时代。无论是商界、学术界还是政府,所有领域都将进入到这个进程。那么究竟什么是大数据,大数据时代对我们的生活带来哪些变革和挑战呢?我们今天请到的嘉宾是《大数据》一书的作者,著名的信息管理专家涂子沛先生和我们阐述《大数据生活方式与社会治理》,有请。解说:涂子沛,知名信息管理专家,中国旅美科学技术协会副主席,兼任华南理工大学公共政策研究院副教授,广东省政府大数据顾问。2012年其著作《大数据》在中国引起了对大数据战略的讨论,被《亚洲周刊》等媒体评为“2012年度中国十大好书”。2013年10月因为在大数据领域的研究和贡献,获第四届中国软科学前沿探索奖 田桐:涂老师您好,非常感谢您的远道而来。 涂子沛:您好田桐,您好,大家好。 田桐:那么其实大数据这样一个词,我们进入到我们的视线当中是从2012年开始的,究竟大数据是一个什么样的概念?它起源于什么时候?涂子沛:对,我们大家现在都在谈大数据,2012年被称为大数据元年,我们说怎么来理解这个大数据这个概念呢?核心要理解什么叫大,田桐你怎么理解什么是大呢? 田桐:所谓这个大数据我不知道是它的容量大还是说它现在所需要,或者今后承载的东西会越来越大?就是这个大是一个质的数字还是说一个量的数字? 涂子沛:没错。 田桐:我不太了解这个。 涂子沛:你说到的,我们说最重要的就是容量在变大,但是容量在变大呢是一个现象,我们说大,还是可以说大房子还有大人物大趋势,这个大的意思是表示重要性、价值。那我们说本质是什么,大数据的本质是数据的价值在增加,除了容量在变大。 田桐:我们看到您的这本书,也是非常火的一本书《大数据》,在它的这个封面的副标题上也写着正在到来的数据革命。您认为这个革命是什么样的革命?会不会是第四次的浪潮? 涂子沛:我们经常说第四次的浪潮是针对说我们有前三次技术的浪潮对吧,18世纪的蒸汽机的浪潮,19世纪内燃机的浪潮到20世纪计算机的浪潮,这股浪潮呢说把我们带进了信息社会、信息时代。我们现在大数据时代来到了,我们说是一个新的浪潮,但是呢我们能不能说这是人类历史上的第四次浪潮?这个结论我们暂时还不能下,我们要拉长历史的镜头,还有待观望,但是大部分学者都认为,我们已经不仅仅处在一个信息时代了。很多人说在我们在一个新的时代,那这个新的时代叫什么名字呢?有的人说叫新信息时代,有人说叫后信息时代,那我有个观点,我认为我们在进入一个智能时代,不是一个简单的信息时代。 田桐:那么所谓的大数据时代,眼看着就要到来了,可能已经到来了,它对于我们来说难道仅仅只是数字上的改变吗?它会对我们的生活起到什么样的变化? 涂子沛:对,数据会影响我们的生活,最大的影响是什么呢?是我们会越来越依赖机器,越来越依赖网络,机器跟网络呢会获得智能,获得智慧,我们会进入一个人机共生的状态。但机器呢又是由数据驱动的,我们的生活会被数据主导,被数据驱动。有一句话说软件在定义这个世界,数据在驱动这个世界。 田桐:那您觉得这是一个好的事情还是一个坏的事情,生活的所有重点全部都由数据来

大数据时代社会治理面临的困境及对策

第15卷第7期2017年7月 淮海工学院学报(人文社会科学版) Journal of H uaihai Institute of TechnologyCHumanities &- Social Sciences Edition) Vol. 15 No. 7 July 2017 DOI:10.3969/j.issn.2095-333X.2017.07.031 大数据时代社会治理面临的困境及对策^ 裴元元 (苏州大学社会学院,江苏苏州215123) 摘要:随着信息技术的不断发展,社会已大步迈入大数据时代。大数据时代所拥有的数据海量性、多样性及可传递性等特征已给社会造成诸多问题,使其陷入新的治理困境。从大数据时代社会治理的特点、面临的挑战及如何应对挑战入手进行讨论,得出了民众意识、制度保障、技术支持、数据共享和网洛安全监管等新的治理途径。 关键词:大数据;社会治理;挑战;治理途径 中图分类号:C916 文献标识码:A文章编号:2095-333X(2017)07-0113-04 随着大数据时代的来临,政府和学界纷纷将目 光转向大数据,激起大数据研究的浪潮。社会治理在大数据时代也迎来了新的机遇和挑战,因此需要变革社会治理方式来适应大数据时代下的社会需求。无论从理论上还是实践上看,创新大数据时代的社会治理方式都将是一个有价值的课题,甚至可以这么说谁率先拥有、善于利用大数据,谁就能掌握主动、赢得未来。如何把握这一机遇、利用机遇,是国家、政府和社会治理部门目前最为关注的问题。 ―、大数据和社会治理 (一)大数据概念及特征 大数据一词最早是由最早洞见大数据时代发展趋势的数据科学家维克托?迈尔一舍恩伯格在《大数据时代:生活、工作与思维的大变革》一书中提出的,他指出,“大数据并非一个确切的概念”[1]8。随后对于大数据的详细定义,不同研究机构有着不同的界定,麦肯锡全球研究院在《大数据:创新、竞争和生产力的下一个前沿》中将大数据定义为“无法在一定时间内使用传统数据库软件工具对其内容进行获取、管理和处理的数据集合”。关于大数据的定义,虽然学术界目前还没有统一的标准,但对于大数据的特征,普遍认为其具有数据容量大、数据类型多、数据传递快、数据价值高和复杂程度高的特点[2]。 首先,大数据最显著的特征就是数据容量巨大,以致用传统数据工具无法有效处理。其次,大数据所包含的数据类型非常复杂,包括结构化数据、半结构化数据以及非结构化的数据。第三,数据传递速度快,大数据的产生已经不再受时空限制,每时每刻每地都在产生大量的数据,这就需要更快更高效率地对数据进行处理。第四,大数据具有潜在价值性,虽然大数据的海量数据资源价值密度非常低,但是所蕴藏的潜在价值非常大,如何挖掘其内在价值以转化为可利用的信息是人们所要研究和关注的重点。第五,数据的复杂程度高,大数据的数据来源已经不局限于某一事件、某一部门,而是涉及人们生产、生活、消费的方方面面,这就对相关的大数据技术有较高要求。 (二)社会治理的内涵 社会治理是指政府、社会组织、企事业单位、社区以及个人通过平等合作、对话、协商、沟通等方式,依法对社会事务、社会组织和社会生活进行引导和规范,最终实现公共利益最大化的过程。它是一项包括政府、企业、社会组织及公众在内的复杂的系统工程。中共十八届三中全会强调创新社会治理体制,突出社会治理创新的重要性,对推进社会治理模式与时倶进和构建和谐社会具有重要的现实意义。在日益动态复杂的外部环境下,社会治理模式要不断适应当前的大环境,不断创新,才能更好地解决现存的社会问题。随着大数据时代的到来,要学会将大数据与社会治理结合来创新性研究大数据时代的新型社会治理。正因为当前研究大数据时代社会治理的相关资料还相对匱乏,所以我们应该注重大数据所拥有的“数据红利”,将其价值应用到社会 *收稿日期:2017-05-18;修订日期:2017-06-22 作者筒介:裴元元(1994一),女,江苏盐城人,苏州大学社会学院硕士研究生,主要从事发展社会学方面的研究。

大数据时代的机遇与挑战

重庆工商大学派斯学院 学年论文 设计题目:大数据时代的机遇与挑战 院系:软件工程学院 专业班级:12计算机科学与技术本科(2)班学生姓名:刘伟学号:2012305039 指导教师:程光德职称:讲师 日期:2015年9月

重庆工商大学派斯学院学年论文(设计)成绩评定表 专业班级计算机本科2班 题目大数据时代的机遇与挑战字数6608 作者刘伟指导教师程光德(职称:讲师)指导教师评语: 初评成绩指导教师(签名) 年月日评阅教师评语: 初评成绩评阅教师(签名) 年月日软件工程学院学年论文(设计)领导小组意见: 综合评定成绩(五级制)负责人(签章) 年月日注:学年论文(设计)成绩按优秀、良好、中等、及格、不及格评定。

目录 一、绪论 (2) (一)什么是大数据 (2) (二)大数据能做些什么 (2) 二、本论 (2) (一)大数据的重要性 (2) 1.大数据的处理分析正成为新一代信息技术融合应用的结点 (2) 2.大数据利用将成为提高核心竞争力的关键因素 (3) 3.大数据资源成为重要战略资源 (3) 4.大数据时代将成为世界发展的主流 (3) 5.大数据时代科学研究的方法手段将发生重大改变 (4) (二)大数据时代的机遇 (4) 1.大数据服务市场崛起 (4) 2.大数据时代的到来将为企业的发展和竞争提供新的出路 (4) 3.大数据技术为政府社会治理带来新机遇 (5) 4.大数据引领新发展 (5) (三)大数据时代的挑战 (5) 1.大数据时代信息技术面临的挑战 (5) 2.数据污染,数据质量差 (6) 3.大数据人才缺乏 (6) 4.商业模式转变的挑战 (7) 5.大数据管理与决策 (7) 三、结论 (8) 参考文献 (9)

公需课考试答案:第七章:大数据与社会治理 - 副本

第七章:大数据与社会治理 第1 题 复杂的网络分析可以让一个被拒绝的用户,关联出一个失信的身份证和设备,而且发现其设备有较多的申请行为,那么,这个被关联出来的用户将需要严格的人工审核甚至可以直接拒绝。(5分) A. 是 B. 否 答题情况:正确选项:A 你答对了! 第2 题 大数据的价值重点在于挖掘,而挖掘就是分析。(5分) A. 是 B. 否 答题情况:正确选项:A 你答对了! 第3 题 我国网络安全防御工程建设还有待加强是因为我国国家投入相对较少。(5分) A. 是 B. 否 答题情况:正确选项:B 你错选为:A 第4 题 城市化网格化管理是运用数字化、信息化,以街道、社区、网格为区域范围,以事件为管理内容,以处置单位为责任人,通过城市网格化管理信息平台,实现市区联动、资源共享的一种社会治理体系下的一种新的城市管理新模式。(5分) A. 是 B. 否 答题情况:正确选项:A 你答对了! 第5 题 8、《十八届三中全会关于全面深化改革若干重大问题的决定》提出,创新社会治理体制,以网格化管理、社会化服务为方向,健全基层综合服务管理平台。(5分) A. 是 B. 否 答题情况:正确选项:A 你答对了! 第6 题 目前复杂网络在银行业的应用在于风控征信,基于大数据的风控需要把不同来源的数据整合到一起,他可以检测数据当中的不一致性。(5分) A. 是 B. 否 答题情况:正确选项:A 你答对了! 第7 题

打通跨行业数据,实现多场景大数据的自动化关联分析与可视化呈现设备、ip、手机号、身份证号、地址、电子邮件等多个维度关联有助于识别支付盗卡、多头申请、团队作案、刷单、撞库登录等多种欺诈风险。(5分) A. 是 B. 否 答题情况:正确选项:A 你答对了! 第8 题 2016年10月21号,在中央政法委举行的第四次百万政法干警学习讲座上,马云以数据和信息的区别入手解释了数据时代是预测未来的时代。(5分) A. 是 B. 否 答题情况:正确选项:A 你答对了! 第9 题 现代社会治理处理除了政府之外,还需要社区的自治。(5分) A. 是 B. 否 答题情况:正确选项:A 你答对了! 第10 题 大数据在社会综合治理的作用,以下理解不正确的是()。(5分) A. 大数据的应用有利于走群众流线 B. 大数据的运用能够维护社会治安 C. 大数据的运用能够杜绝抗生素的滥用 D. 大数据的运用能够加强交通管理 答题情况:正确选项:C 你错选为:A 第11 题 ()是我国网络社会治理的方针。(5分) A. 分工负责、齐抓共管 B. 积极防御、综合防范 C. 一手抓管理,一手抓发展 D. 保障公民权益,维护社会稳定 答题情况:正确选项:B 你错选为:D 第12 题 智慧城市的构建不包括()。(5分) A. 数字城市 B. 物联网 C. 联网监控 D. 云计算 答题情况:正确选项:C 你错选为:B

《大数据时代的政府治理创新》考试答案

《大数据时代的政府治理创新》 考试答案 注意:题目顺序可能会有不同,请注意核对!为杜绝试卷答案的完全一致性,本群只提供考核通过基本分60分的标准答案,未提供答案的题目请自行答题。 ? 1.社会成员或者用户之间社会成员之间共同参与信息的处理、信息的分享、信息的传播,这个活动就叫( B )。(单选题4分) o A.云计算 o B.社会计算 o C.政府计算 o D.高强度计算 ? 2.科学范式的发展路径:从观察到演绎分析、模型推导,到计算机分析、仿真模拟,再到( A )时期。(单选题4分) o A.数据科学 o B.理论科技 o C.数据推导 o D.数据计算 ? 3.( C )时代,使得信息智慧解读时代到来。(单选题4分) o A.Web1.0 o B.Web2.0 o C.Web3.0 o D.Web4.0 ? 4.Web2.0强调( A )。(单选题4分) o A.个人

o B.单位 o C.网站 o D.机构 ? 5.梅特卡尔夫定律主要是描述信息网络,指出网络的价值在于网络的互联,联网的接点数与其价值呈现( A )的方式,联网越多,系统的价值越大。(单选题4分) o A.指数 o B.正比 o C.反比 o D.对数 ? 6.( B )说明如果联网越多,从介入方式、技术上越来越突破,则网络规模越大、成本越低,网络的成本可能会趋向于零。(单选题4分) o A.摩尔定律 o B.吉尔德定律 o C.梅特卡尔夫定律 o D.新摩尔定律 ?7.政府2.0不以政府为中心,而是以公众为中心,建设()政府。(单选题4分)o A.服务型 o B.创新型 o C.节约型 o D.开放型 ?8.具体来说,摩尔定律就是每()个月,产品的性能将提高一倍。(单选题4分)o A.6 o B.12

推进大数据时代社会治理创新

推进大数据时代社会治理创新 现阶段,我国正处于社会转型加速期。随着社会的快速发展和急剧变迁,包括人、财、物、事等在的社会治理数据和信息变得越来越庞大和复杂,而这与当前大数据技术的发展正好不期而遇。针对目前社会治理领域普遍存在的服务理念滞后、决策机制不够科学、部门协作亟须加强、工作效率亟待提升等问题,大数据技术从认识、理论、方法、实践和效果评估等方面都能给人们全新的视野,为社会转型期的社会治理创新带来了机遇。 大数据时代下社会治理的特点 从技术层面来看,大数据时代社会信息化和政府信息化程度前所未有,物联网、云计算、数据整合、基于语义网的Web3.0、关联数据、信息发布等新技术的发展及普及,为政府治理实现“智能”化提供了技术支撑,将从根本上改革政府组织模式和政府形态,进而改变政府治理模式,影响整个政府存在的形态。从长远来看,大数据将对政府治理式、政府职能和政府自身管理等多个方面产生影响。 公共服务的开放化、推送化、个性化 公共服务环境“开放化”。大数据时代,数据将成为一种权利,开放将成为一种潮流,公共服务环境的开放达到前所未有的程度。数据的开放和流动,代表着知识的开放和流动,代表着权力的开放和流动。在开放的环境中,要求公共服务机制更加完善,需求将更加明确,

服务配置将更加优化,服务方式更加灵活,服务供给更加丰富,服务质量更加高效,社会生产力将得到更大解放和发展。 公共服务方式“推送化”。大数据时代公共服务供给将由“索取”向“推送”转变,这一转变涵盖了两层意思:一是公共服务态度变得更加主动,从“被动”向“主动”转变。大数据时代,无论是公众还是政府的行为都被放在“第三只眼”观察下,为此公共服务将变得更加“主动”,主动对公共服务进行过程追踪,确保公共服务质量,从而有效解决食品、药品等行业的安全问题;主动改进公共服务质量,政府部门可通过分析大数据来判断公众对公共服务质量的评价,借此来改善服务,提高客户满意度。二是公共服务提供方式变成“推送”,网络外部性使得政府数据发布随着受众群体的增加,成本越来越低,倍增效应越来越大,当政府意识到数据开放的收益远大于其成本时,被动的索取将向主动的推送转变。 公共服务产品“个性化”。大数据时代的到来,让数据挖掘更加深入和精细化,有条件引导政府提供更加个性化的公共服务。例如在医疗卫生行业,相关部门可以从多个渠道获取个人健康信息,把职业、行为等行为数据与电子病历等医疗数据关联起来,形成一个综合的健康状况模式,提供精细化的医疗服务。另一方面,大数据时代以语义网为代表的Web3.0技术将成为主流,政府通过对公众在政府、微博等的浏览次数、栏目关注度、在线申请服务、发表评论等多项活动的分析,运用数据挖掘技术工具等对公众活动进行关联,进而主动形成个性化的服务。 公共决策的社会化 公共决策趋于“社会化”。大数据时代,政府决策呈现三个特征。

大数据时代下社会治理与创新

大数据时代下社会治理与创新 大数据一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。当今社会下,数据已经渗透到当今每一个行业和业务职能领域。 何谓大数据时代? 麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据具有5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)Veracity(真实性)。“大数据”是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。那么,大数据到底有多大呢?有一组名为“互联网上一天”的数据告诉我们,一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量);发出的社区帖子达200万个(相当于《时代》杂志770年的文字量);卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万……截止到2012年,数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。国际数据公司(IDC)的研究结果表明,2008年全球产生的数据量为0.49ZB,2009年的数据量为0.8ZB,2010年增长为1.2ZB,2011年的数量更是高达1.82ZB,相当于全球每人产生200GB以上的数据。而到2012年为止,人类生产的所有印刷材料的数据量是200PB,全 人类历史上说过的所有话的数据量大约是5EB。IBM的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。而到了2020年,全世界所产生的数据规模将达到今天的44倍。每一天,全世界会上传超过5亿张图片,每分钟就有20小时时长的视频被分享。

相关文档
相关文档 最新文档