过去的十年,我们经常听说的是互联网时代,而我们现在更经常听到的是大数据时代。
大数据这个词,听起来高大上。
但到底什么是大数据呢,优就业专业讲师给大家详细解读一番。
大数据首先是一个非常大的数据集,可以达到TB(万亿字节)甚至ZB(十万亿亿字节)。
这里面的数据可能既有结构化的数据,也有半结构化和非结构化的数据,而且来自于不同的数据源。
结构化的数据是什么呢?对于接触过关系型数据库的小伙伴来说,应该一点都不陌生。
对了,就是我们关系型数据库中的一张表,每行都具有相同的属性。
如下面的一张表:每行数据都有相同的属性,这就是结构化的数据。
我们再来看半结构化数据。
XML或JSON格式的数据就是我们所常见的半结构的数据。
如,下面所示的XML数据:<book><name>大数据时代</name><author>赵牟</author><price>¥60.5</price></book>子标签的次序和个数不一定完全一致。
那什么又是非结构化数据呢?这类数据没有预定义完整的数据结构,在我们日常工作生活中可能更多接触的就是这类数据,比如,图片、图像、音频、视频、办公文档等等。
知道了这三类结构的数据,我们再来看看大数据的数据源有哪些呢?归纳起来大致有五种数据源。
一是社交媒体平台,如有名气的Facebook、Twitter、YouTube和Instagram等。
媒体是最受欢迎的大数据