大数据有多“大”

慕蓉 2021-11-25

大数据数据分析

1060 字丨阅读本文需 3 分钟

这是“慕蓉”公众号第345篇原创文章

专栏 | 数字化商业

近三年来,跟区块链齐名被喊烂了的一个词就是“大数据”,然后我们真的了解什么是大数据吗?多大的数据量算大?今天笔者就对大数据分析一事尝试进行解读。

我们先来想想,提起大数据我们第一时间想的是什么?一个特别大的EXCEL?一块数据大屏幕?还是行程码?可能每个人的理解都不太一样,这里面就有一个何为“数据”的概念,要先搞懂什么是数据。

“数据(data)是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。数据是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的原始素材。”

收集数据最常见的方式就是调查问卷,我们过去经常填的一张张表格就是一个个数据点,理论上我们收集的数据越多,数据的价值就越大,因为这个代表了一个区域的覆盖信息,早期的快消品公司,常年花费大量的人力物力来做消费行为的普查就是为了收集更多的消费者行为数据,为他们的市场行为决策做依据。但是调研问卷的过去大部分采用人工的方式会有如下三方面问题:

1.人力消耗巨大,对于调研者,问卷的发放、回收、整理都是大量的人力配备。

2. 时间消耗,对于被调研者配合回答问题需要消耗时间,往往被调研者很难配合。

3.准确度不高,问卷回收整理,形成报告,过程数据容易有错误。

现在我们可能对数据有个清楚的认识了,那接下来我们再说到了大数据时代,大数据到底有多大?

英特尔公司首席执行官Brian Krzanich表示,2020年互联网用户每天将产生1.5GB的数据。

20年全世界互联网用户有多少呢?超过40亿,这就意味着每天在互联网产生的数据达到60亿GB。如果你没有直观的概念,想想你电脑的容量,大概500G吧,那就意味着,每天互联网产生的数据达到1.2亿台电脑的容量。在大数据的领域GB是非常小的单位,基本数据是以PB开始计算的,数据的单位换算如下表。

对于大数据的定义,有如下五种特点:

1.多样性

数据的形式是多种多样的,比如文本、图像、视频、网页等等,这些数据不仅限于过去的结构化数据,更多的是非结构化的。

2.巨量性

数据量巨大,上面已经说的很多了,这里不详诉。

3.快速增长

数据增长极为快速,数据成爆炸式的增长,系统短时间即可收集海量数据,对于数据处理的速度要求越来越高。

4.低价值性

面对海量数据,有价值的数据就很容易被覆盖掉,大量不完整错误的数据涌向数据收集者,如何设置漏斗模型,筛选有价值的数据,对于大数据从业者来说,比较有挑战。

5.真实性

由于数据体量的巨大,造假成为几乎不可能的行为。

大数据的特性以上可以略知一二,从大数据概念被提出到现在,我们可以看到在各行各业都已经逐步应用,大数据真正的意义不在于收集,更多在于对有价值的数据的挖掘。人类文明从来都不缺数据信息的创造,更需要的是对于数据价值的挖掘和再利用。

免责声明:凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处本网。非本网作品均来自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如您发现有任何侵权内容,请依照下方联系方式进行沟通,我们将第一时间进行处理。

0赞 好资讯,需要你的鼓励
来自:慕蓉
0

参与评论

登录后参与讨论 0/1000

为你推荐

加载中...