内容简介:遇见大数据可视化:基础研究
作者:腾讯云
近日星巴克与微信推出的社交礼品功能“用星说”,可以说刷遍了朋友圈。无论你爱不爱喝咖啡,星巴克似乎都成为了一种文化象征。上班族青睐,小清新喜欢,基本上大家看到绿色的人鱼标志就能马上认出它来。
虽然一直也有喝咖啡的习惯,但至今不知道星巴克菜单版上列的【摩卡】、【拿铁】、【美式】、【卡布奇诺】等等有什么区别。直到看到下列图,才很直观的了解到每个咖啡类别的区别是什么。
类似上图示,针对内容复制,难以形象表达的信息,通过图形简单清晰地向受众呈现出来,这种图称之为信息图。
信息图
信息图本身是一个合成词,由信息和图两个词组成多称之为(Infographics或Infographics Graphics),在40年代的时候就开始出现,使用在报纸及新闻类杂志方面,其中杰出的代表阿根廷的信息图先驱Alejandro Malofiej,在1993年西班牙设立了以他为名的主要针对信息图表设计的Malofiej奖。
在报纸、杂志等纸质媒体中,为了让读者感到新奇且直观容易的理解,运用了大量的信息图解的表现。
如下图所示:
为什么人们会对信息图的传播内容更有效呢?主要原因是因为视觉是人类最强的信息输入方式,人类感知周围世界最强的方式,在Brain Rules《大脑法则》一书中,发展分子生物学家John Medina写道:“视觉是迄今我们最主要的感官,占用了我们大脑中一半的资源。”信息图提供了一种语境的方法(Language of Context),通过展示多个维度数值并且相互比较来为受众提供语境,使我们更高效的把内容反射到大脑中。
后来随着技术的发展,除了传统的纸质媒体出现了以互联网为主的电脑,电视,手机,大屏终端等更多类型的电子媒体。信息图的分类也逐步划分为:图解(Diagram) 、图表(Chart) 、 表格(Table) 、统计图(Graph) 、 地图(Map)和图形符号(Pictogram)这几部分。
图解Diagram – 主要运用插图对事物进行说明
图表 Chart – 运用图形、线条及插图等,阐明事物的相互关系
表格 Table – 根据特定信息标准进行区分,设置纵轴与横轴
统计图 Graph – 通过数值来表现变化趋势或进行比较
地图 Map – 描述在特定区域和空间里的位置关系
图形符号 Pictogram – 不使用文字,运用图画直接传达信息
我们来看一组简单的数据,比较下图形和数据对于人脑感观的差异。
从数据上很难看出有什么区别,因为每组数据看上去都十分的相近。下面我们把这四组数据转换成图表来进行对比下。
将数据图形化后,大脑天然的会对图形的不同点做出反应,从而更高效的理解数据带来的意义。
我们再来看下其他例子:
这种用图形化对数据进行描述设计的过程,我们通常称为【数据可视化】。有时候,可视化的结果可能只是一个条形图表,但大多数的时候可视化的过程会很复杂的,因为数据本身可能会很复杂的。一般流程包括【数据收集】-【数据分析&清理】-【可视化设计】,从抽象的原始数据到可视化图像。
数据
数据是可视化的基础,它不仅仅是数字,要想把数据可视化,就必须知道它表达的是什么。根据Ben Shneiderman的分类,信息可视化的数据分为以下几类:
一维数据:X轴一个维度如果1、2、3、4 •••
二维数据:X,Y两个二维度(1、2),(3、4),(5、6),(7、8)•••
三维数据:X,Y,Z三个维度(1、2、3),(4、5、6),(7、8、9) •••
多维数据:X,Y,Z,•••多个维度(1、2、3、4、•••),(5、6、7、8、•••)
时态数据:具有数据属性的数据集合。
层次数据:具有等级或层次关系数据集合。
数据种类划分是十分多的,但是这些数据都描述了现实的世界中的一部分,是现实世界的一个快照。除了类型,数据的数量级也影响这数据的表达结果。
我们来看一个数据:【2017年1月28号,成都PM2.5值245】,从这个数据里能看出什么,可能只是会觉得当天成都空气质量不好,我们可能会联想到这个样一个画面。
OK,我们继续丰富我们的原始数据,在中国环境监测总站(http://www.cnemc.cn/) 的网站获取到成都2017年整个1月份的PM2.5的数据。
中国环境监测总站作为空气质量公开的数据来源,它提供了获取数据的API接口。通过API接口我们可以获取到原始数据。
可视化
通俗地说,可视化设计的目的是“让数据说话”,用图形去讲述数据的故事。可视化是一种表达数据的方式,是现实世界的抽象表达。它像文字一样,为我们讲述各种各样的故事。作为一种媒介,可视化已经发展成为一种很好的故事讲述方式。
我们把成都PM2.5的数据,按照日期和当天的PM2.5指数做出最简单图形来,我们可以得到下面这类的图表来。
那什么是好的可视化作品呢?
好的可视化设计需要具备统计和设计方面的知识。没有前者,可视化只是插图和美术练习;没有后者,可视化就只是研究分析结果。统计和设计的知识都只能帮助你完成数据图形的一部分。
我们需要去讲述数据的故事。那PM2.5代表的是什么,是当天天气的情况,所以我们可以用天气的维度去讲述这个故事。
好的可视化设计能让你有一见钟情的感觉,你知道眼前的东西就是你想看到的。既可以是艺术的,同时又是真实的。而不是直接把数据转换成图表,找到数据和它所代表事物之间的关系按照“数字化叙事”去做设计,这是全面分析数据的关键,同样还是深层次理解数据的关键。
当然好的数据可视化图都是不断迭代优化出来的,判断是不是一个好的数据可视化可以按照以下的步骤去考虑。【你有什么数据】 -> 【关于数据你想知道什么】 -> 【数据可视化的表现方式】 -> 【你看到了什么?有意义吗?】。每一个问题的答案都取决于前一个答案,不断的去问自己,每个环节有没有问题,这样才能做出最好的设计。
End.
以上所述就是小编给大家介绍的《遇见大数据可视化:基础研究》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- 遇见大数据可视化 : 图表的视觉系统感知
- 遇见大数据可视化:来做一个数据可视化报表
- 遇见大数据可视化: 未来已来,变革中的数据可视化
- 遇见 ZooKeeper:初识
- 遇见一名程序员的故事
- 【译】当 Kotlin 遇见 Gradle
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
深入理解LINUX内核(第三版)
(美)博韦,西斯特 / 陈莉君;张琼声;张宏伟 / 中国电力出版社 / 2007-10-01 / 98.00元
为了彻底理解是什么使得Linux能正常运行以及其为何能在各种不同的系统中运行良好,你需要深入研究内核最本质的部分。内核处理CPU与外界间的所有交互,并且决定哪些程序将以什么顺序共享处理器时间。它如此有效地管理有限的内存,以至成百上千的进程能高效地共享系统。它熟练地统筹数据传输,这样CPU 不用为等待速度相对较慢的硬盘而消耗比正常耗时更长的时间。 《深入理解Linux内核,第三版》指导你对内核......一起来看看 《深入理解LINUX内核(第三版)》 这本书的介绍吧!