认识“大数据”

上一篇 / 下一篇  2015-08-17 15:40:33 / 个人分类:金融行业测试

大数据——这是近几年来非常火的名词。我有幸拜读了周涛先生翻译的《大数据时代——生活工作与思维的大变革》(作者:Victor Mayer-Schonberger and Kenneth Cukier),从传统的思维中跳出来,结识了新的大数据思维。Vicotr博士提出大数据时代,要全量非样本,要混杂非精确,要相关非因果。

一、全量非样本

在传统的科学领域和研究中,我们采取抽样的方式获取研究的参考数据。我们有人收到抽样调查表格,填写个人的信息。这种收集方式是无法获取全部数据的。但是,Victor博士举例:谷歌通过全量搜索数据分析,预测到了流感发生的时间。现在社会的信息化已经非常**,政府和企业都采用信息化系统进行业务数据存储,所以获取全量数据是非常容易的。基于全量数据进行大数据分析,得到分析结果也成为可能。

二、混杂非精确

大数据需要结合各类数据,那么数据结构、格式非统一,数据内容多样化。小数据时代的统一的数据结构和数据内容进行计算和分析,例如生成某个统计报表。大数据要求数据越多越好,包括种类、内容,从大量混杂的数据中,从不同的角度,通过数据建模和分析算法,得到各种分析结果。

三、相关非因果

大数据从全量数据能够预测到某一种现象的发生,例如Farecast预测机票价格,Decide.com预测商品的价格。但是它不能告诉你为何会产生这一结果。它只能通过有效的模型和算法,对数据相关性进行分析,预测这样的结果。实际上机票价格变化可能是天气原因,商品价格变化可能是成本提高。这些原因是大数据分析不能告诉你的。

 

数据、技术和思维,是大数据时代的三把利剑,获取更大的数据,使用完善的技术,最重要的,不同角度的分析思维。如何进行数据建模,编写有效的算法,最终如何转化成对企业、对个人有利的结果,这是大数据分析的挑战。

Victor博士对大数据使用也有深深的担忧。移动互联网时代,个人的通讯信息(运营商掌控者我们的通讯数据)、财产信息(如银行、支付宝、P2P网站掌握着我们的财产)、社交网络信息(QQ、微信)等都暴露在网络中,如果个人隐私被恐怖主义或心怀不轨者利用,进而威胁到公民的人身、财产安全。所以,对于数据的使用,希望政府对数据使用者出台政策法案,约束其使用途径,并对个人的数据安全负起责任。

大数据时代来了,虽然“危机”并存,但是我们要拥抱这个变革,转换思维方式,提升技术能力,一起迎接这个全新的信息时代。


TAG:

 

评分:0

我来说两句

Open Toolbar