内容简介:将排名列表进行可视化是一个非常常见的任务,现在已经存在了很多种可视化方法。这篇文章首先对现有方法做了很好的总结和分析,然后设置了详细的用户知觉实验,来比较不同的排名列表可视化方法。Bar chart是我们最常用的chart —— 使用bar作为mark,使用length作为channel。众多周知,position是最有效的channel。但实际上,在baseline的帮助下,length的效果和position差不多。在所有的排名列表可视化方法中,Horizontal bar chart占据主导地位。一方
将排名列表进行可视化是一个非常常见的任务,现在已经存在了很多种可视化方法。这篇文章首先对现有方法做了很好的总结和分析,然后设置了详细的用户知觉实验,来比较不同的排名列表可视化方法。
- 背景
Bar chart是我们最常用的chart —— 使用bar作为mark,使用length作为channel。众多周知,position是最有效的channel。但实际上,在baseline的帮助下,length的效果和position差不多。
在所有的排名列表可视化方法中,Horizontal bar chart占据主导地位。一方面,水平的放置更加利于label的摆放,另一方面,一般PC的屏幕上,水平方向的分辨率更大,可以带来更大的精度。然而,这个可视化受限于屏幕的大小,若列表项的数量特别多时,需要增加scroll。Scroll的引进不会影响到水平方向的精确感知,但会浪费用户的时间和精力。
- wrapped bars
Stephen Few在2013年提出了Wrapped bars [1],旨在消除掉scrolling的影响。他将整个列表划分成C列,通过压缩水平方向的长度来使得屏幕上能放置所有的bar。这样做的坏处在于,将不会有一个统一的baseline,同时每个bar的长度也比以前窄了很多。
- packed bars
Xan Gregg在2017年提出了Packed bars [2],希望能最大地利用屏幕上的空间。因为bar越长,bar的精度就越高。他使用一个贪心的算法来布局。这样布局会造成原有顺序的丢失,且除了第一列外,不再具有baseline。
- piled bars
MehmetAdilYalçın在2017年提出了Piled bars [3]。与wrapped bars类似,他将整个列表划分成C列,所有的列都共享一个baseline,然后使用颜色和阴影来区分不同的堆积次序。这样做的好处在于,每个bar都利用了最大的水平分辨率,但是,极端情况下,label会相互重叠。
- zvinca plot
Stephen Few在2017年提出了Zvinca plot [4]。与piled bars类似,只是将bar变成了dot,channel相应地由length变成了position。这样做的好处在于,不需要使用颜色和阴影,同时dot的label布局将会更加自由,以减少重叠。
- treeMap
treeMap [5]是一个常见的用于表示层次结构数据的可视化方法,但是最近越来越多的人使用它来可视化排名列表。该篇文章中所使用的布局方法是squarified treemap layouts。这种布局之下,每个item的位置隐含了排名信息。Treemap的问题在于使用了面积来编码value,但是面积并不是一个精度很高的channel。
- bubble chart
与treeMap类似的还有packed bubble chart [6],它使用圆而不是矩形来作为mark。在布局上,这个算法更依赖于碰撞检测,所以每个项的位置几乎没有任何含意。
文章把这7中方法全总结了一边,结果如下。
为了实际比较这些可视化方法,作者设计了3个实验任务。
- 任务1:给定一个选中的项,要求被试给出该项的排名等级。
- 任务2:给定两个选中的项,要求被试给出该两项的值的差距
- 任务3:要求被试评估所有项的平均值。
用户总共选取了180个被试(from Amazon Mechanical Turk)。每个被试将会被分配一个可视化形式(共6个,无packed bubble chart),1个可视化任务(共3个),3个数据集(75,150,300),完成10次试验。
分析结果之前,作者做了两个假设
- 假设1:SB将会显著慢于其他可视化形式。因为scrolling会耗费大量的时间。
- 假设2:TM的正确率将会显著低于其他可视化形式。因为面积不是一个很精确的channel
结果如下:
其实该篇论文的结果并不是特别好。我这里挑选了一部分有意思的,来进行解释“
- 针对假设1,综合来看SB确实比其他的慢一些,但某些情况下,差距不明显。
- 针对假设2,TM的正确率从来没有最低过,某些情况下还是最佳。拒绝假设2。
- 在任务1中,WB的表现最好,TM的表现非常不错。
- 在任务2中,ZP的正确率最低,TM仍旧有非常好的表现。
- 在任务3中,treeMap和PaB都有较高的错误率。
- 结合数据规模来看,在任务2中,只有SB的时间随着数据量的增大而增加。在任务3中,ZP和TM的时间反而随着数据量的增大而减少。
在我看来,这篇文章有一些值得商榷的东西
- 数据规模太小了,而且没有区分度
- treeMap是一个严重依赖于布局算法的可视化形式
- 这几个任务都比较基础,我们可能需要一些更高级的分析任务
- 结果分析不是很严谨,没有统计学上的结果分析
总的来说,这篇文章对排名列表可视化做了一个非常好的总结。
[1] Few, Stephen, and Perceptual Edge. “Wrapping Graphs to Extend Their Limits.” Visual Business Intelligence Newsletter (2013).
[2] Xan Gregg. 2017. Introducing the Packed Bars Chart Type. In Poster Proceedings of IEEE VIS .
[3] Mehmet Adil Yalçın, Niklas Elmqvist, and Benjamin B Bederson. 2017. Piled Bars: Dense Visualization of Numeric Data. In Poster Proceedings of the Graphics Interface Conference .
[4] Yalçin, Mehmet Adil, Niklas Elmqvist, and Benjamin B. Bederson. “Raising the Bars: Evaluating Treemaps vs. Wrapped Bars for Dense Visualization of Sorted Numeric Data.” Graphics Interface . 2017.
[5] Johnson, Brian, and Ben Shneiderman. Tree-maps: A space-filling approach to the visualization of hierarchical information structures . IEEE, 1991.
[6] Wang, Weixin, et al. “Visualization of large hierarchical data by circle packing.” Proceedings of the SIGCHI conference on Human Factors in computing systems . ACM, 2006.
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- 遇见大数据可视化:来做一个数据可视化报表
- 遇见大数据可视化: 未来已来,变革中的数据可视化
- Python 数据可视化 2018:数据可视化库为什么这么多?
- 数据可视化设计(1)情感化设计指导可视化设计理念
- 基于WebGL架构的ThingJS可视化平台—城市地下管线3D可视化
- 可视化工具不知道怎么选?深度评测5大Python数据可视化工具
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。