内容简介:遇见大数据可视化:基础研究
作者:腾讯云
近日星巴克与微信推出的社交礼品功能“用星说”,可以说刷遍了朋友圈。无论你爱不爱喝咖啡,星巴克似乎都成为了一种文化象征。上班族青睐,小清新喜欢,基本上大家看到绿色的人鱼标志就能马上认出它来。
虽然一直也有喝咖啡的习惯,但至今不知道星巴克菜单版上列的【摩卡】、【拿铁】、【美式】、【卡布奇诺】等等有什么区别。直到看到下列图,才很直观的了解到每个咖啡类别的区别是什么。
类似上图示,针对内容复制,难以形象表达的信息,通过图形简单清晰地向受众呈现出来,这种图称之为信息图。
信息图
信息图本身是一个合成词,由信息和图两个词组成多称之为(Infographics或Infographics Graphics),在40年代的时候就开始出现,使用在报纸及新闻类杂志方面,其中杰出的代表阿根廷的信息图先驱Alejandro Malofiej,在1993年西班牙设立了以他为名的主要针对信息图表设计的Malofiej奖。
在报纸、杂志等纸质媒体中,为了让读者感到新奇且直观容易的理解,运用了大量的信息图解的表现。
如下图所示:
为什么人们会对信息图的传播内容更有效呢?主要原因是因为视觉是人类最强的信息输入方式,人类感知周围世界最强的方式,在Brain Rules《大脑法则》一书中,发展分子生物学家John Medina写道:“视觉是迄今我们最主要的感官,占用了我们大脑中一半的资源。”信息图提供了一种语境的方法(Language of Context),通过展示多个维度数值并且相互比较来为受众提供语境,使我们更高效的把内容反射到大脑中。
后来随着技术的发展,除了传统的纸质媒体出现了以互联网为主的电脑,电视,手机,大屏终端等更多类型的电子媒体。信息图的分类也逐步划分为:图解(Diagram) 、图表(Chart) 、 表格(Table) 、统计图(Graph) 、 地图(Map)和图形符号(Pictogram)这几部分。
图解Diagram – 主要运用插图对事物进行说明
图表 Chart – 运用图形、线条及插图等,阐明事物的相互关系
表格 Table – 根据特定信息标准进行区分,设置纵轴与横轴
统计图 Graph – 通过数值来表现变化趋势或进行比较
地图 Map – 描述在特定区域和空间里的位置关系
图形符号 Pictogram – 不使用文字,运用图画直接传达信息
我们来看一组简单的数据,比较下图形和数据对于人脑感观的差异。
从数据上很难看出有什么区别,因为每组数据看上去都十分的相近。下面我们把这四组数据转换成图表来进行对比下。
将数据图形化后,大脑天然的会对图形的不同点做出反应,从而更高效的理解数据带来的意义。
我们再来看下其他例子:
这种用图形化对数据进行描述设计的过程,我们通常称为【数据可视化】。有时候,可视化的结果可能只是一个条形图表,但大多数的时候可视化的过程会很复杂的,因为数据本身可能会很复杂的。一般流程包括【数据收集】-【数据分析&清理】-【可视化设计】,从抽象的原始数据到可视化图像。
数据
数据是可视化的基础,它不仅仅是数字,要想把数据可视化,就必须知道它表达的是什么。根据Ben Shneiderman的分类,信息可视化的数据分为以下几类:
一维数据:X轴一个维度如果1、2、3、4 •••
二维数据:X,Y两个二维度(1、2),(3、4),(5、6),(7、8)•••
三维数据:X,Y,Z三个维度(1、2、3),(4、5、6),(7、8、9) •••
多维数据:X,Y,Z,•••多个维度(1、2、3、4、•••),(5、6、7、8、•••)
时态数据:具有数据属性的数据集合。
层次数据:具有等级或层次关系数据集合。
数据种类划分是十分多的,但是这些数据都描述了现实的世界中的一部分,是现实世界的一个快照。除了类型,数据的数量级也影响这数据的表达结果。
我们来看一个数据:【2017年1月28号,成都PM2.5值245】,从这个数据里能看出什么,可能只是会觉得当天成都空气质量不好,我们可能会联想到这个样一个画面。
OK,我们继续丰富我们的原始数据,在中国环境监测总站(http://www.cnemc.cn/) 的网站获取到成都2017年整个1月份的PM2.5的数据。
中国环境监测总站作为空气质量公开的数据来源,它提供了获取数据的API接口。通过API接口我们可以获取到原始数据。
可视化
通俗地说,可视化设计的目的是“让数据说话”,用图形去讲述数据的故事。可视化是一种表达数据的方式,是现实世界的抽象表达。它像文字一样,为我们讲述各种各样的故事。作为一种媒介,可视化已经发展成为一种很好的故事讲述方式。
我们把成都PM2.5的数据,按照日期和当天的PM2.5指数做出最简单图形来,我们可以得到下面这类的图表来。
那什么是好的可视化作品呢?
好的可视化设计需要具备统计和设计方面的知识。没有前者,可视化只是插图和美术练习;没有后者,可视化就只是研究分析结果。统计和设计的知识都只能帮助你完成数据图形的一部分。
我们需要去讲述数据的故事。那PM2.5代表的是什么,是当天天气的情况,所以我们可以用天气的维度去讲述这个故事。
好的可视化设计能让你有一见钟情的感觉,你知道眼前的东西就是你想看到的。既可以是艺术的,同时又是真实的。而不是直接把数据转换成图表,找到数据和它所代表事物之间的关系按照“数字化叙事”去做设计,这是全面分析数据的关键,同样还是深层次理解数据的关键。
当然好的数据可视化图都是不断迭代优化出来的,判断是不是一个好的数据可视化可以按照以下的步骤去考虑。【你有什么数据】 -> 【关于数据你想知道什么】 -> 【数据可视化的表现方式】 -> 【你看到了什么?有意义吗?】。每一个问题的答案都取决于前一个答案,不断的去问自己,每个环节有没有问题,这样才能做出最好的设计。
End.
以上所述就是小编给大家介绍的《遇见大数据可视化:基础研究》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- 遇见大数据可视化 : 图表的视觉系统感知
- 遇见大数据可视化:来做一个数据可视化报表
- 遇见大数据可视化: 未来已来,变革中的数据可视化
- 遇见 ZooKeeper:初识
- 遇见一名程序员的故事
- 【译】当 Kotlin 遇见 Gradle
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Cascading Style Sheets 2.0 Programmer's Reference
Eric A. Meyer / McGraw-Hill Osborne Media / 2001-03-20 / USD 19.99
The most authoritative quick reference available for CSS programmers. This handy resource gives you programming essentials at your fingertips, including all the new tags and features in CSS 2.0. You'l......一起来看看 《Cascading Style Sheets 2.0 Programmer's Reference》 这本书的介绍吧!